문제
CRISP-DM 분석 방법론의 데이터 준비 단계에서 수행하는 활동 중 적절하지 않은 것은?
① 데이터 정제 ② 데이터 통합 ③ 데이터 탐색 ④ 데이터 포맷팅
정답
3번
해설
정답: 3. 데이터 탐색은 데이터 이해(Data Understanding) 단계의 활동이다. 데이터 준비 단계는 정제·통합·포맷팅 등 모델링용 데이터셋을 만드는 활동으로 구성된다.
오답 풀이
- 1번: 결측·오류 처리 등 데이터 정제는 준비 단계 활동이다.
- 2번: 여러 원천의 데이터 통합도 준비 단계 활동이다.
- 3번: 탐색은 이해 단계의 활동이므로 옳지 않다.
- 4번: 분석 도구에 맞춘 포맷팅도 준비 단계 활동이다.
보충 개념 CRISP-DM 데이터 준비 단계: 데이터 선택, 정제, 통합, 포맷팅, 새로운 데이터(파생변수) 생성. 데이터 이해 단계: 초기 데이터 수집, 기술(記述), 탐색, 품질 확인.