문제
다음 중 데이터 마이닝 기법에 대한 설명으로 적절하지 않은 것은?
① 반응변수가 주어지지 않은 상태에서 데이터 자체의 결합이나 유사성을 토대로 숨겨진 구조를 찾아내는 기법으로 k-means 군집분석이 활용될 수 있다. ② 의사결정나무는 결과에 대한 이유를 설명하기 어렵기 때문에 화이트박스 모형으로 분류된다. ③ 인공신경망(ANN)은 입력층, 은닉층, 출력층으로 구성되며 복잡한 비선형 관계를 파악하는 데 유용하다. ④ 연관 규칙 분석은 항목 간의 ‘만약 ~하면, ~하다’라는 형태의 관계를 발견하는 기법으로 장바구니 분석이라고도 한다.
정답
2번
해설
정답: 2. 의사결정나무는 분리 규칙을 그대로 따라가며 결과를 설명할 수 있는 대표적인 화이트박스 모형이다. ‘설명하기 어렵기 때문에’라는 서술이 모순이다.
오답 풀이
- 1번: k-means는 레이블 없이 유사성으로 군집을 찾는 비지도 기법이다.
- 2번: 화이트박스인 이유는 해석이 쉽기 때문이므로 서술이 옳지 않다.
- 3번: ANN의 구조와 비선형 학습 능력에 대한 옳은 설명이다(대신 해석이 어려운 블랙박스 모형).
- 4번: 연관 규칙의 If-Then 형태와 장바구니 분석 명칭은 옳다.
보충 개념 해석 가능성 비교 — 화이트박스: 의사결정나무·회귀분석, 블랙박스: 인공신경망·앙상블(부분적).