문제
다중 선형 회귀분석에서 독립변수들 간의 관계에 대한 설명으로 가장 옳지 않은 것은?
① 독립변수 간 상관관계가 높으면 다중공선성 문제가 발생할 수 있다. ② VIF(Variance Inflation Factor) 값이 클수록 다중공선성이 심하다. ③ 독립변수가 많을수록 항상 모델의 예측력이 향상된다. ④ 다중공선성은 회귀계수의 해석을 어렵게 만든다.
정답
3번
해설
독립변수가 많다고 항상 예측력이 향상되는 것은 아닙니다. 과적합, 다중공선성, 차원의 저주 등으로 오히려 성능이 저하될 수 있습니다. ①②④는 다중공선성에 대한 올바른 설명입니다.