문제
의사결정나무에서 불순도 측정 지표에 대한 설명으로 가장 옳은 것은?
① 지니 불순도는 항상 엔트로피보다 높은 값을 가진다 ② 엔트로피는 클래스가 균등하게 분포할 때 최솟값을 가진다 ③ 분류 오차율은 계산이 복잡하여 실무에서 거의 사용되지 않는다 ④ 지니 불순도는 클래스가 완전히 순수할 때 0의 값을 가진다
정답
4번
해설
지니 불순도는 한 클래스로 완전히 분류되었을 때(순수할 때) 0의 값을 가집니다. ①지니와 엔트로피의 크기 관계는 상황에 따라 다름, ②엔트로피는 균등 분포일 때 최댓값을 가짐, ③분류 오차율은 계산이 간단하지만 미분 불가능하여 최적화에 부적합합니다.