문제
데이터 전처리 과정에서 이상값(Outlier) 탐지 방법으로 가장 적절한 것은?
① IQR(사분위수 범위)을 이용한 방법 ② Z-score를 이용한 방법 ③ 박스플롯을 이용한 시각적 탐지 ④ 위의 모든 방법이 적절하다.
정답
4번
해설
④가 정답입니다. ①IQR 방법(Q1-1.5×IQR, Q3+1.5×IQR 범위 밖), ②Z-score 방법(|Z|>2 또는 3), ③박스플롯 시각화 모두 이상값 탐지에 널리 사용되는 유효한 방법들입니다. 데이터 특성에 따라 적절한 방법을 선택하거나 여러 방법을 조합해서 사용합니다.