문제
다음은 주성분 분석(PCA) 결과 각 주성분의 분산 설명 비율이다. 누적 분산 비율이 80% 이상이 되도록 할 때 선택해야 할 최소 주성분의 수는?
| 주성분 | PC1 | PC2 | PC3 | PC4 | PC5 |
|---|---|---|---|---|---|
| 분산 설명 비율 | 0.45 | 0.25 | 0.15 | 0.10 | 0.05 |
① 2 ② 3 ③ 4 ④ 5
정답
2번
해설
정답: 2. 누적 분산 비율은 PC1까지 0.45, PC2까지 0.70, PC3까지 0.85이다. 80% 이상을 처음 만족하는 것은 PC3까지이므로 최소 3개의 주성분이 필요하다.
오답 풀이
- 1번: PC2까지의 누적 비율은 0.70으로 80%에 미달한다.
- 3·4번: 3개로 이미 0.85 ≥ 0.80을 만족하므로 최소 개수가 아니다.
보충 개념 주성분 수 선택 기준: 누적 분산 비율(통상 70~90%), 고유값 1 이상(Kaiser 기준), Scree plot의 엘보 지점.