문제
탐색적 데이터 분석(EDA)에서 활용되는 시각화 기법에 대한 설명으로 가장 적절한 것은?
① 산점도는 두 범주형 변수 간의 관계를 파악하는 데 가장 효과적이다. ② 상자그림(Box Plot)은 데이터의 분포와 이상값을 동시에 확인할 수 있다. ③ 히스토그램은 변수 간 상관관계를 시각화하는 데 주로 사용된다. ④ 열지도(Heatmap)는 시계열 데이터의 추세를 파악하는 데 가장 적합하다.
정답
2번
해설
상자그림은 데이터의 중앙값, 사분위수, 최솟값, 최댓값을 표시하여 분포를 보여주며, 동시에 이상값도 점으로 표시하여 한 번에 확인할 수 있습니다. ① 산점도는 두 연속형 변수 간의 관계를 파악하는 데 사용됩니다. ③ 히스토그램은 하나의 연속형 변수의 분포를 시각화합니다. ④ 열지도는 상관관계나 2차원 데이터의 패턴을 시각화하는 데 주로 사용되며, 시계열 추세 파악에는 선그래프가 더 적합합니다.