인공지능 모델을 처음 만들 때, '데이터를 넣고 한 번만 계산하면 끝나는 거 아닌가?' 하고 생각할 수 있어요. 저도 그랬거든요. 하지만 신경망은 마치 우리 학생들처럼, 한 번에 모든 걸 깨우치지 못해요. 여러 번 반복해서 데이터를 보고 또 보면서 조금씩 똑똑해지는 거죠. 바로 이때 가장 중요하게 등장하는 개념이 **'에폭(Epoch)'**과 **'배치(Batch)'**랍니다. 이 두 가지가 어떻게 모델을 성장시키는지 함께 알아볼까요? 😊

1. 에폭(Epoch)이란? 전체 학습의 큰 그림 🖼️
가장 먼저 이해해야 할 개념은 바로 '에폭'이에요. 간단히 말해, 에폭은 전체 데이터를 한 번 모두 학습하는 과정을 의미해요. 예를 들어 우리가 1,000장의 고양이 사진 데이터셋을 가지고 있다고 상상해 볼게요. 모델이 이 1,000장의 사진을 처음부터 끝까지 한 번씩 모두 보고 순전파와 역전파 과정을 거쳤다면, 그것이 바로 '1 에폭'이 완료된 것이랍니다.
당연히 한 번만 봐서는 부족하겠죠? 그래서 우리는 여러 에폭을 설정해서 훈련을 반복해요. 에폭 횟수가 늘어날수록 모델은 데이터의 패턴을 더 잘 파악하고 정답에 가까워지게 됩니다. 마치 시험공부할 때 교과서를 여러 번 정독하는 것과 같아요!
학생이 두꺼운 수학 교과서를 처음 1페이지부터 마지막 페이지까지 통째로 한 번 다 읽는 것. 이게 바로 '1 에폭'이에요. 한 번 읽어서는 모든 공식을 외우기 힘드니, 여러 번 반복해서 읽어야 실력이 쑥쑥 늘겠죠?

2. 배치(Batch)란? 똑똑하게 나눠서 공부하기 📚
자, 이제 '배치'에 대해 알아볼게요. 1,000장의 사진을 한 번에 컴퓨터 메모리에 올려서 계산하려면 시스템에 엄청난 부담이 가겠죠? 그래서 데이터를 한꺼번에 처리하는 대신, 작은 묶음 단위로 잘게 나눠서 학습시키는 방법이 바로 '배치' 방식이에요.
다시 1,000장의 사진 예시로 돌아가서, 이걸 100장씩 묶음으로 나눴다고 해볼게요. 이때 이 100장이 바로 **'배치 크기(Batch Size)'**가 됩니다. 모델은 첫 100장을 학습하고 가중치를 한 번 업데이트하고, 그다음 100장을 또 학습하고 가중치를 업데이트하는 과정을 반복하죠. 총 10번의 배치를 처리하면, 비로소 1 에폭이 완료되는 셈이에요.
수학 교과서 1권을 하루 만에 다 읽는 건 너무 힘들잖아요? 그래서 우리는 보통 **'챕터별'로 계획을 세워 공부하죠.** 여기서 '챕터'가 바로 '배치'와 같아요. 부담도 덜고, 더 집중해서 효율적으로 공부할 수 있게 도와주는 현명한 방법이죠.
3. 미니배치 학습: 현실적인 최적의 선택 🎯
배치 크기를 어떻게 설정하느냐에 따라 학습 방식이 조금씩 달라져요. 이론적으로는 세 가지로 나눌 수 있는데, 현실에서는 이 세 번째 방법을 가장 많이 사용한답니다.
| 학습 방법 | 배치 크기 | 특징 |
|---|---|---|
| 온라인 학습 (Online) | 1 | 데이터 1개마다 가중치 업데이트. 매우 민감하고 불안정함. |
| 배치 학습 (Batch) | 전체 데이터 | 한 번에 모든 데이터를 처리. 안정적이지만 메모리 부담이 큼. |
| 미니배치 학습 (Mini-batch) | 적절한 값 (e.g., 32, 64, 128) | 두 방법의 장점을 절충. 속도와 안정성의 균형을 맞춤 (가장 보편적) |
📝 에폭과 배치의 조합 예시
- 총 데이터: 1,000개
- 배치 크기: 100
- 에폭: 10번
👉 해석: 1,000개의 데이터를 100개씩 묶어서 총 10번 학습시키면 1 에폭이 끝납니다. 이 전체 과정을 총 10번 반복하라는 의미입니다. 따라서 모델의 가중치는 총 100번(10번/에폭 * 10에폭) 업데이트됩니다.
에폭 & 배치 한눈에 보기
자주 묻는 질문 ❓
이제 에폭과 배치의 관계가 한눈에 그려지시나요? 교과서를 통째로 몇 번 읽을지(에폭) 정하고, 하루에 몇 챕터씩 공부할지(배치) 계획하는 것처럼, 이 두 가지를 어떻게 조합하느냐에 따라 학습의 효율과 결과가 크게 달라진답니다.
다음 편에서는 이렇게 열심히 공부시켰더니 오히려 시험을 망치는(?) 경우, 즉 훈련을 너무 과하게 시켜서 발생하는 **'과적합' 문제**와 이를 해결하는 똑똑한 방법들에 대해 알아보겠습니다. 더 궁금한 점이 있다면 언제든지 댓글로 남겨주세요~ 😊