문제
다음 중 상자그림(Boxplot)에 대한 설명으로 적절하지 않은 것은?
① 상자그림 내부의 수평선은 해당 데이터의 중앙값을 나타낸다. ② 사분위수 범위(IQR)는 전체 데이터의 50%가 분포하는 구간의 길이를 나타낸다. ③ IQR의 1.5배를 초과하여 벗어난 관측치는 이상치로 정의할 수 있다. ④ 상자그림의 폭과 길이 비교를 통해 해당 데이터의 관측치 개수를 파악할 수 있다.
정답
4번
해설
정답: 4. 상자그림은 5수치 요약(최소·Q1·중앙값·Q3·최대)을 보여줄 뿐 관측치의 개수는 나타내지 않는다.
오답 풀이
- 1번: 상자 내부의 선은 중앙값이다.
- 2번: IQR(Q3−Q1)은 가운데 50% 데이터 구간의 길이이다.
- 3번: Q1−1.5×IQR, Q3+1.5×IQR을 벗어나면 이상치로 판정한다.
- 4번: 상자의 폭·길이는 산포를 나타낼 뿐 표본 크기와 무관하므로 옳지 않다.
보충 개념 상자그림은 분포의 중심·산포·치우침·이상치를 한눈에 보여주지만, 관측치 수나 다봉성(multimodality)은 표현하지 못한다.