문제
의사결정나무에서 불순도 측정 지표에 대한 설명으로 가장 옳지 않은 것은?
① 이진 분류에서 지니 불순도는 0과 0.5 사이의 값을 가진다. ② 엔트로피는 클래스 분포가 균등할 때 최대값을 가진다. ③ 정보 획득(Information Gain)이 클수록 좋은 분할 기준이다. ④ 지니 불순도와 엔트로피는 항상 동일한 분할 결과를 제공한다.
정답
4번
해설
④가 정답입니다. 지니 불순도와 엔트로피는 서로 다른 수학적 공식을 사용하므로 항상 동일한 분할 결과를 제공하지는 않습니다. 대부분의 경우 비슷한 결과를 보일 수 있지만 완전히 같지는 않습니다. ①은 이진 분류 기준에서 지니 불순도가 0~0.5 사이의 값을 가지므로 옳고, ②는 엔트로피가 클래스 분포가 균등할 때 최대값을 가지므로 옳으며, ③은 정보 획득이 클수록 분할 후 불순도가 더 많이 감소하므로 좋은 분할 기준이 되어 옳습니다.