문제
랜덤 포레스트(Random Forest)에서 예측 성능을 높이기 위한 방법으로 가장 적절하지 않은 것은?
① 트리의 개수(n_estimators)를 증가시킨다 ② 각 분할에서 고려할 특성 수(max_features)를 조정한다 ③ 모든 특성을 동일한 가중치로 사용한다 ④ 부트스트랩 샘플링을 통해 다양성을 확보한다
정답
3번
해설
랜덤 포레스트는 특성 선택의 무작위성을 통해 다양성을 확보하는 것이 핵심입니다. 모든 특성을 동일한 가중치로 사용하면 트리들 간의 상관관계가 높아져 앙상블의 효과가 감소합니다. ①트리 개수 증가, ②특성 수 조정, ④부트스트랩 샘플링은 모두 성능 향상에 도움이 됩니다.