문제
다음 중 회귀분석 모형 적합성을 판단하는 설명으로 적절하지 않은 것은?
① 회귀모형의 적합성을 판단하기 위해 잔차 산점도를 확인하며, 잔차가 특정 패턴 없이 무작위로 분포해야 모형의 가정이 충족된 것으로 본다. ② 다중회귀분석에서는 독립변수의 수가 늘어나면 결정계수가 무의미하게 높아지는 단점을 보완하기 위해 수정된 결정계수를 평가지표로 활용하기도 한다. ③ 회귀계수의 유의성은 t-검정으로 판단 가능하며, 해당 독립변수가 종속변수를 설명하는 데 유의미한지 확인 가능하다. ④ 설명변수 간 상관계수를 확인하면 해당 회귀분석 모형의 적합성을 판단할 수 있다.
정답
4번
해설
정답: 4. 설명변수 간 상관계수는 다중공선성 진단에 활용될 뿐, 모형이 데이터를 얼마나 잘 설명하는지(적합성)를 판단하는 지표가 아니다.
오답 풀이
- 1번: 잔차의 무작위 분포는 등분산성·선형성 가정 충족의 근거이다.
- 2번: 수정된 결정계수는 변수 수 증가에 따른 R² 과대평가를 보정한다.
- 3번: 개별 회귀계수의 유의성은 t-검정으로 판단한다.
- 4번: 변수 간 상관 확인은 공선성 점검이지 적합성 판단이 아니므로 옳지 않다.
보충 개념 모형 적합성 판단: 결정계수·수정 결정계수, F-검정(모형 전체 유의성), t-검정(개별 계수), 잔차 진단(정규성·등분산성·독립성).