문제
의사결정나무에서 정보 이득(Information Gain) 계산에 대한 설명으로 가장 옳지 않은 것은?
① 정보 이득은 분할 전 엔트로피에서 분할 후 가중 평균 엔트로피를 뺀 값이다 ② 정보 이득이 클수록 해당 속성으로 분할했을 때 불순도 감소 효과가 크다 ③ 정보 이득은 항상 음수 값을 가지며, 절댓값이 클수록 좋은 분할이다 ④ C4.5 알고리즘에서는 정보 이득비(Gain Ratio)를 사용하여 편향을 보정한다
정답
3번
해설
정답: ③ 정보 이득은 항상 0 이상의 값을 가집니다. 분할 후 불순도가 감소하므로 정보 이득은 양수이며, 값이 클수록 좋은 분할입니다. ①②④는 모두 올바른 설명입니다.