문제
데이터 정제(Data Cleaning) 과정에서 수행하는 작업으로 가장 적절하지 않은 것은?
① 중복 데이터 제거 ② 결측값 처리 ③ 모델 성능 평가 ④ 이상값 탐지 및 처리
정답
3번
해설
③ 모델 성능 평가는 데이터 정제 과정이 아니라 모델링 단계에서 수행하는 작업입니다. 데이터 정제는 분석에 적합한 품질의 데이터를 만드는 전처리 과정입니다. ① 중복 데이터 제거, ② 결측값 처리, ④ 이상값 탐지 및 처리는 모두 데이터 정제의 주요 작업입니다.