문제
다음은 프로야구 선수의 연봉(단위: 백만 원)을 종속변수로 한 다중회귀분석 결과이다. 해석으로 옳지 않은 것은?
① 타율과 홈런은 유의수준 0.05에서 연봉에 유의한 영향을 준다. ② 다른 변수가 일정할 때 홈런이 1개 증가하면 연봉은 평균적으로 약 894만 원 증가한다. ③ 경력은 유의수준 0.05에서 통계적으로 유의하지 않다. ④ 결정계수가 0.563이므로 이 모형은 연봉 변동의 약 75%를 설명한다.
정답
4번
해설
정답: 4. 결정계수 0.563은 모형이 연봉 총 변동의 약 56.3%를 설명한다는 의미이다. 75%는 결정계수의 제곱근(상관계수 수준)을 혼동한 잘못된 해석이다.
오답 풀이
- 1번: 타율(p=4.8e-05)과 홈런(p=4.1e-06) 모두 0.05보다 작아 유의하다.
- 2번: 홈런 계수 8.94(백만 원) = 894만 원의 평균 증가로 옳다.
- 3번: 경력의 p-value 0.2052 > 0.05이므로 유의하지 않다.
- 4번: R² 값 자체가 설명 비율이므로 옳지 않다.
보충 개념 R²는 모형이 설명하는 변동의 비율이며, 다중회귀에서는 변수 수를 보정한 수정 결정계수(Adjusted R²)를 함께 확인한다.