문제
앙상블 모형에 대한 설명으로 옳은 것은?
① 부스팅은 각 모델을 병렬 학습한 후 최종 결과를 보팅 방식으로 집계하여 통합한다. ② 부스팅은 이전 모델의 오차를 보완하기 위해 순차적으로 모형을 학습한다. ③ 앙상블 모델은 항상 단일 모형보다 정확한 분석 성능을 보여준다. ④ 모델 간 상관관계를 낮추어 예측 성능을 향상시키는 분석 모형이다.
정답
2번
해설
정답: 2. 부스팅은 이전 모델이 잘못 예측한 데이터에 가중치를 높여 다음 모델이 보완하도록 순차적으로 학습하는 방식이다.
오답 풀이
- 1번: 병렬 학습 후 보팅으로 집계하는 것은 배깅의 방식이다.
- 2번: 부스팅의 순차 학습 원리를 올바르게 설명했다.
- 3번: 앙상블이 항상 단일 모형보다 우수한 것은 아니다(데이터·기저 모형에 따라 다름).
- 4번: 모델 간 상관을 낮추는 것은 배깅·랜덤포레스트의 성능 향상 원리에 대한 설명으로, 부스팅을 포함한 앙상블 전체의 정의는 아니며 보기 중 가장 정확한 설명은 2번이다.
보충 개념 배깅은 분산 감소, 부스팅은 편향 감소에 효과적이며, 랜덤포레스트는 배깅에 변수 무작위 선택을 더해 모델 간 상관을 낮춘다.