문제
아래 의사결정나무 노드 C의 지니 계수는?
① 0.44 ② 0.46 ③ 0.48 ④ 0.50
정답
3번
해설
정답: 3. 노드 C의 전체 데이터는 20 + 30 = 50건이므로 Good 비율 p₁ = 20/50 = 0.4, Bad 비율 p₂ = 30/50 = 0.6입니다. 지니 계수 = 1 − Σpᵢ² = 1 − (0.4² + 0.6²) = 1 − (0.16 + 0.36) = 0.48입니다.
오답 풀이
- 1·2번: 비율 환산 또는 제곱합 계산이 잘못된 값입니다.
- 4번: 0.50은 두 클래스 비율이 0.5/0.5로 균등할 때의 최대값입니다.
보충 개념 지니 계수는 0(완전 순수)에서 0.5(이진 분류 최대 불순)까지의 값을 가지며, 값이 작을수록 노드가 순수합니다.