SQLD데이터 분석난이도 3MCQ

SQLD 데이터 분석 기출문제 #10138

문제

의사결정나무에서 불순도 측정 지표에 대한 설명으로 가장 옳지 않은 것은?

① 이진 분류에서 지니 불순도는 0과 0.5 사이의 값을 가진다. ② 엔트로피는 클래스 분포가 균등할 때 최대값을 가진다. ③ 정보 획득(Information Gain)이 클수록 좋은 분할 기준이다. ④ 지니 불순도와 엔트로피는 항상 동일한 분할 결과를 제공한다.

정답

4

해설

④가 정답입니다. 지니 불순도와 엔트로피는 서로 다른 수학적 공식을 사용하므로 항상 동일한 분할 결과를 제공하지는 않습니다. 대부분의 경우 비슷한 결과를 보일 수 있지만 완전히 같지는 않습니다. ①은 이진 분류 기준에서 지니 불순도가 0~0.5 사이의 값을 가지므로 옳고, ②는 엔트로피가 클래스 분포가 균등할 때 최대값을 가지므로 옳으며, ③은 정보 획득이 클수록 분할 후 불순도가 더 많이 감소하므로 좋은 분할 기준이 되어 옳습니다.

SQLD 시험 준비 가이드

이런 문제 20~50개를 한 번에 풀어보세요

매번 새로 추가되는 모의고사 + 오답 자동 복습 + 회차별 실력 추적. 회원가입 후 무료 이용.