문제
다음 R 회귀분석 결과에 대한 해석으로 부적절한 것은?
<회귀분석 요약>
- 종속변수: Fertility
- 독립변수: Agriculture, Examination, Education, Catholic, Infant.Mortality 총 5개
- 잔차 자유도: 41
- Agriculture 회귀계수: 음수
- 일부 회귀계수의 p-value는 유의수준 0.05보다 큼
- Adjusted R-squared: 0.671
① 데이터의 개수는 자유도와 독립변수 개수를 이용해 46으로 볼 수 있다. ② 모든 회귀계수가 통계적으로 유의한 것은 아니다. ③ Agriculture가 증가하면 Fertility는 감소한다. ④ 조정결정계수는 0.671이다.
정답
1번
해설
정답: 1. 잔차 자유도 = n - 추정 모수 개수. 독립변수 5 + 절편 1 = 6 추정 → n = 41+6 = 47. 데이터 개수를 46으로 보는 해석은 부적절합니다.
오답 풀이
- 1번: 절편까지 고려하면 데이터 개수는 47입니다.
- 2번: 일부 p-value가 유의수준보다 크므로 모든 회귀계수가 유의하지는 않습니다.
- 3번: 음수 계수는 Agriculture 증가 시 Fertility 감소를 의미합니다.
- 4번: Adjusted R-squared 0.671 그대로입니다.