문제
분류 문제에서 정보 획득(Information Gain) 계산에 대한 설명으로 가장 적절한 것은?
① 분할 전 지니 지수에서 분할 후 가중 평균 지니 지수를 뺀 값이다 ② 분할 전 엔트로피에서 분할 후 가중 평균 엔트로피를 뺀 값이다 ③ 분할 후 엔트로피에서 분할 전 엔트로피를 뺀 값이다 ④ 각 클래스의 확률을 곱한 후 로그를 취한 값이다
정답
2번
해설
정보 획득(Information Gain)은 분할 전 엔트로피에서 분할 후 가중 평균 엔트로피를 뺀 값으로 계산됩니다. 이는 분할로 인해 얻어지는 정보의 양을 측정하는 지표입니다. ①은 지니 획득, ③은 계산 순서가 반대, ④는 엔트로피 공식의 일부분입니다.