합격 후기 작성하고 2,000원 쿠폰 받아가세요! (게시글 탭 → 합격후기)

데이터분석 준전문가(ADsP)데이터 분석의사결정나무난이도 2MCQ

데이터분석 준전문가(ADsP) 의사결정나무 기출문제 #12337

문제

다음 중 의사결정나무 모델에 대한 설명으로 적절하지 않은 것은?

① 데이터 분류 기준으로는 지니 지수 및 엔트로피, 카이제곱 통계량이 활용된다. ② 연속형 변수인 경우, 의사결정나무 모형은 학습 데이터에 대해 항상 예측 정확도 100%의 모델 구현이 가능하다. ③ 하위 노드로 내려갈수록 데이터 불순도는 점차 감소한다. ④ 불필요한 분기를 제거하는 가지치기를 통해 모델의 일반화 성능을 향상시킬 수 있다.

정답

2

해설

정답: 2. 동일한 입력값에 서로 다른 목표값이 존재하는 등 데이터에 노이즈가 있으면 학습 데이터에서도 100% 정확도는 불가능하며, 100%에 가깝게 만들더라도 그것은 과적합일 뿐 ‘항상 가능’한 것이 아니다.

오답 풀이

  • 1번: 지니·엔트로피·카이제곱은 분류나무의 분리 기준이다.
  • 2번: ‘항상 100% 가능’이라는 단정이 옳지 않다.
  • 3번: 분리를 거듭할수록 각 노드의 순도가 높아져 불순도는 감소한다.
  • 4번: 가지치기는 과적합을 줄여 일반화 성능을 높인다.

보충 개념 의사결정나무는 정지 규칙(최소 관측치 수·최대 깊이)과 가지치기(비용-복잡도)를 통해 과적합을 통제한다.

데이터분석 준전문가(ADsP) 데이터 분석 다른 기출문제

데이터분석 준전문가(ADsP) 시험 준비 가이드

이런 문제 20~50개를 한 번에 풀어보세요

매번 새로 추가되는 모의고사 + 오답 자동 복습 + 회차별 실력 추적. 회원가입 후 무료 이용.

[데이터분석 준전문가(ADsP)] 의사결정나무 데이터 분석 기출 #12337 | 문어CBT