문제
데이터 전처리에서 이상값(Outlier) 탐지 방법으로 가장 적절하지 않은 것은?
① 사분위수 범위(IQR)를 이용한 방법 ② Z-score를 이용한 방법 ③ 박스플롯을 이용한 시각적 탐지 ④ 정규분포 가정 없이 단순 최댓값과 최솟값 제거
정답
4번
해설
④번이 정답입니다. 단순히 최댓값과 최솟값을 제거하는 것은 이상값이 아닌 정상 데이터까지 삭제할 수 있어 적절하지 않습니다. ①②③은 모두 통계적 근거를 바탕으로 한 적절한 이상값 탐지 방법입니다.