문제
다중회귀분석에서 다중공선성에 대한 설명으로 적절하지 않은 것은?
① 다중공선성이 존재하더라도 회귀계수의 분산은 항상 동일하다. ② 독립변수 간 높은 상관관계로 회귀계수 추정이 불안정해진다. ③ 다중공선성은 VIF 지표로 측정 가능하다. ④ 높은 상관관계를 갖는 설명변수를 모형에서 제거하여 해결 가능하다.
정답
1번
해설
정답: 1. 다중공선성이 존재하면 회귀계수 추정량의 분산이 크게 팽창하여 추정이 불안정해진다. 분산이 항상 동일하다는 설명은 옳지 않다.
오답 풀이
- 1번: 공선성은 계수의 표준오차를 키우므로 옳지 않다.
- 2번: 독립변수 간 강한 상관은 계수 추정의 불안정을 초래한다.
- 3번: VIF(분산팽창요인)가 대표적인 진단 지표이다.
- 4번: 상관 높은 변수의 제거는 기본적인 해결 방법이다.
보충 개념 VIF = 1/(1 − Rⱼ²)로 계산하며, 통상 10 이상(엄격하게는 5 이상)이면 다중공선성을 의심한다.