문제
회귀분석에 따른 잔차도가 아래 그림과 같을 때, 해당 분석의 해석으로 옳은 것은?
① 잔차가 0을 중심으로 고르게 분포하므로 회귀모형이 적합하다. ② 릿지, 라쏘 모델을 사용하여 해당 분석 결과의 과적합 문제를 해결해야 한다. ③ 독립변수와 종속변수 간 비선형성이 확인되어 비선형 모델을 적용해야 한다. ④ 해당 잔차도 그래프는 변수에 이상치(outlier)가 많아서 발생한 패턴이다.
정답
3번
해설
정답: 3. 잔차가 U자형 곡선 패턴을 보이는 것은 선형모형이 포착하지 못한 비선형(곡선) 관계가 남아 있다는 신호이므로, 변수 변환이나 비선형 모형의 적용을 고려해야 한다.
오답 풀이
- 1번: 잔차에 뚜렷한 곡선 패턴이 있으므로 무작위 분포가 아니다.
- 2번: 릿지·라쏘는 과적합·다중공선성 대응 기법이지 비선형성 문제의 해법이 아니다.
- 3번: U자형 잔차 패턴의 표준적 해석으로 옳다.
- 4번: 체계적인 곡선 패턴은 이상치가 아니라 모형의 함수 형태가 잘못되었음을 의미한다.
보충 개념 잔차 진단 — 곡선 패턴: 비선형성(다항항·변환 추가), 깔때기 패턴: 이분산성(가중회귀·변환), 시점에 따른 패턴: 자기상관(시계열 모형).