문제
랜덤 포레스트(Random Forest)의 특성에 대한 설명으로 가장 옳지 않은 것은?
① 부트스트랩 샘플링을 통해 여러 개의 의사결정나무를 생성한다 ② 각 노드에서 전체 변수 중 일부만 무작위로 선택하여 분할한다 ③ 개별 나무들의 예측을 평균(회귀) 또는 투표(분류)로 결합한다 ④ 나무의 개수가 증가하면 반드시 과적합이 심해진다
정답
4번
해설
④ 랜덤 포레스트는 나무의 개수가 증가해도 일반적으로 과적합이 심해지지 않습니다. 오히려 충분한 수의 나무를 사용하면 일반화 성능이 안정화됩니다. ①②③은 모두 랜덤 포레스트의 올바른 특성들입니다.