문제
다음 중 주성분 분석(PCA)에 대한 설명으로 옳지 않은 것은?
① 주성분 분석은 비지도 학습이다. ② 분산을 극대화하는 방향으로 주성분을 생성한다. ③ 상관관계가 높은 변수들의 선형결합을 통해 차원을 축소하여 변수를 축약한다. ④ 주성분 수는 데이터 수만큼 생성이 가능하다.
정답
4번
해설
정답: 4. 주성분은 최대 변수의 개수만큼 생성할 수 있으며, 데이터(관측치) 수만큼 생성되는 것이 아니다.
오답 풀이
- 1번: PCA는 종속변수 없이 데이터 구조만으로 축을 찾는 비지도 학습이다.
- 2번: 제1주성분은 데이터의 분산을 가장 크게 설명하는 방향으로 정의된다.
- 3번: 상관 높은 변수들의 선형결합으로 소수의 주성분에 정보를 축약한다.
- 4번: 주성분의 최대 개수는 원래 변수의 수이므로 옳지 않다.
보충 개념 주성분 수 선택 기준: 고유값 1 이상(Kaiser 기준), 누적 분산 비율 70~90%, Scree plot의 엘보 지점.