문제
앙상블 학습에 대한 설명으로 적절하지 않은 것은?
① 배깅(Bagging)은 복원추출 기반의 부트스트랩 샘플을 생성하여 각 샘플마다 학습시킨 후 모든 모델의 예측 결과를 하나로 합치는 방식이다. ② 부스팅(Boosting)은 개별 모델에 동일한 가중치를 부여하여 순차적으로 학습한다. ③ 보팅(Voting)은 각 모델 예측 결과 중 가장 많이 나온 결과를 최종 결과로 채택한다. ④ 랜덤포레스트(Random Forest)는 배깅 방식을 기반으로 하여 복수의 독립적인 의사결정나무를 생성 후 예측을 수행한다.
정답
2번
해설
정답: 2. 부스팅은 이전 모델이 틀린 데이터에 더 높은 가중치를 부여하며 순차 학습한다. 동일한 가중치를 부여한다는 설명은 옳지 않다.
오답 풀이
- 1번: 배깅은 부트스트랩 샘플별 학습 후 집계(보팅·평균)하는 방식이다.
- 2번: 오분류 데이터의 가중치를 갱신하므로 동일 가중치가 아니다.
- 3번: 다수결 보팅의 정의로 옳다.
- 4번: 랜덤포레스트는 배깅 + 변수 무작위 선택으로 다수의 트리를 만든다.
보충 개념 AdaBoost는 오분류 표본의 가중치를 키우고, GBM은 잔차(기울기)를 다음 모델이 학습하는 방식의 부스팅이다.