문제
주성분분석 결과에 대한 설명으로 틀린 것은?
<USArrests 데이터 PCA 결과 요약>
- PC1 설명분산 비율: 약 62.0%
- PC2 설명분산 비율: 약 24.7%
- PC1 + PC2 누적 설명분산 비율: 약 86.7%
| 변수 | PC2 loading | PC3 loading |
|---|---|---|
| Murder | 0.418 | -0.341 |
| Assault | 0.188 | -0.268 |
| UrbanPop | -0.873 | -0.378 |
| Rape | -0.167 | 0.818 |
① 성분 2개로 4개 변수의 분산을 86% 이상 설명할 수 있다. ② PC2에 가장 크게 기여하는 변수는 UrbanPop이다. ③ PC3에 가장 크게 기여하는 변수는 Rape이다. ④ 전반적으로 Murder의 영향력이 가장 크다.
정답
4번
해설
정답: 4. PCA 결과는 주성분별 기여도와 loading을 함께 봐야 하며, Murder의 영향력이 가장 크다고 단정하기 어렵다.
오답 풀이
- 1번: 첫 두 주성분 누적 설명력 약 86.7% 해석은 타당하다.
- 2번: PC2에서 UrbanPop의 loading 절댓값이 가장 크다면 맞는 설명이다.
- 3번: PC3에서 Rape의 loading 절댓값이 가장 크다면 맞는 설명이다.
- 4번: 변수 영향력은 주성분별 loading과 설명분산을 함께 봐야 하므로 단정하기 어렵다.