문제
지니 불순도(Gini Impurity)의 주요 활용 목적으로 가장 적절한 것은?
① 값이 클수록 데이터가 순수한 상태를 의미한다. ② 이진 분류에서 최댓값은 1이다. ③ 의사결정나무에서 분할 기준을 선택할 때 활용된다. ④ 연속형 변수에만 적용 가능한 측도이다.
정답
3번
해설
지니 불순도는 의사결정나무에서 노드를 분할할 때 가장 좋은 분할 기준을 선택하는 데 사용되는 불순도 측도입니다. ① 값이 작을수록 순수한 상태를 의미합니다. ② 이진 분류에서 지니 불순도의 최댓값은 0.5이므로 틀렸습니다. ④ 지니 불순도는 클래스 분포의 불순도를 측정하는 지표로, 연속형 변수에만 적용되는 측도가 아닙니다.