문제
데이터 전처리 과정에서 이상값(Outlier) 처리 방법으로 가장 부적절한 것은?
① IQR(사분위수 범위)를 이용한 이상값 탐지 ② Z-score를 이용한 이상값 탐지 ③ 이상값을 무조건 삭제하여 처리 ④ 박스플롯을 이용한 이상값 시각화
정답
3번
해설
이상값을 무조건 삭제하는 것은 부적절합니다. 이상값이 실제 의미 있는 데이터일 수 있으므로 원인을 파악하고 적절한 방법으로 처리해야 합니다. ①②④는 모두 적절한 이상값 처리 방법입니다.