문제
의사결정나무에서 지니 계수(Gini Index)의 특성으로 가장 적절한 것은?
① 값이 클수록 노드의 순수도가 높다는 것을 의미한다. ② 이진 분류에서 최댓값은 1이다. ③ 모든 데이터가 한 클래스에 속할 때 최솟값 0을 가진다. ④ 엔트로피와 달리 로그 함수를 사용하여 계산한다.
정답
3번
해설
③이 정답입니다. 지니 계수는 불순도 측정 지표로, 모든 데이터가 한 클래스에 속하면 지니 계수는 0이 됩니다. ①은 틀렸습니다. 지니 계수는 값이 작을수록 노드의 순수도가 높습니다. ②는 틀렸습니다. 이진 분류에서 지니 계수의 최댓값은 0.5입니다. ④는 틀렸습니다. 지니 계수는 로그를 사용하지 않으며, 엔트로피가 로그 함수를 사용합니다.