문제
아래 주성분 분석(PCA)의 Scree plot을 통해 유의미한 주성분의 수로 적절한 것은?
① 1 ② 3 ③ 5 ④ 7
정답
2번
해설
정답: 2. Scree plot에서 고유값이 가파르게 감소하다가 완만해지는 엘보(elbow) 지점이 4번째 주성분부터이며, 고유값 1 기준선 위에 있는 주성분도 3개까지이므로 유의미한 주성분 수는 3개이다.
오답 풀이
- 1번: 1개만 선택하면 두 번째·세 번째 주성분이 설명하는 큰 분산을 놓친다.
- 3·4번: 4번째 이후의 주성분은 고유값이 1 미만으로 작아 추가 설명력이 미미하다.
보충 개념 Scree plot은 주성분 번호별 고유값을 그린 그래프로, 곡선이 완만해지기 직전까지의 주성분을 선택한다. 고유값 1 이상 기준(Kaiser)과 함께 사용된다.