문제
다음 중 탐색적 데이터 분석(EDA)의 특징으로 적절하지 않은 것은?
① 데이터의 전반적인 구조를 파악하고 이상치 및 결측치를 발견하는 단계이다. ② 동일한 분석 결과를 얻기 위해 재현성을 검증하는 단계이다. ③ 상관관계 분석 및 시각화를 통해 종속변수에 영향을 주는 주요 독립변수를 탐색한다. ④ 변수의 개수, 데이터 타입 및 기초 통계량(평균, 중앙값)을 확인하는 단계이다.
정답
2번
해설
정답: 2. 재현성 검증은 모델 평가·검증 단계의 활동이며, EDA는 데이터의 구조와 패턴을 탐색하는 단계이다.
오답 풀이
- 1번: 분포·이상치·결측 파악은 EDA의 핵심 활동이다.
- 2번: 재현성 검증은 EDA의 특징이 아니므로 옳지 않다.
- 3번: 상관분석·시각화를 통한 주요 변수 탐색은 EDA 활동이다.
- 4번: 변수 구성·기초 통계량 확인도 EDA의 기본 활동이다.
보충 개념 EDA의 4가지 주제: 저항성, 잔차 해석, 자료 재표현, 현시성(시각화).