문제
다음은 신용카드 부채(Balance)를 종속변수로 하고 수입(Income)과 학생 여부(Student: 학생=Yes)를 독립변수로 한 다중회귀분석 결과이다. 해석으로 옳지 않은 것은?
① Income이 1 증가할 때 Balance는 평균적으로 약 5.98 증가한다. ② 학생은 비학생에 비해 Balance가 평균적으로 약 382.67 높다. ③ Student 변수는 더미변수로 처리되어 기준 범주(비학생) 대비 효과를 나타낸다. ④ StudentYes의 회귀계수가 Income보다 크므로 Student가 Balance에 가장 중요한 변수이다.
정답
4번
해설
정답: 4. 회귀계수의 크기는 변수의 측정 단위에 의존하므로 계수의 절대값만으로 변수의 중요도를 비교할 수 없다. 중요도 비교에는 표준화 회귀계수 등이 필요하다.
오답 풀이
- 1번: 다른 변수가 일정할 때 Income 1단위 증가에 따른 Balance의 평균 증가량은 5.984이다.
- 2번: StudentYes 계수는 비학생 대비 학생의 평균 Balance 차이(약 382.67)를 의미한다.
- 3번: 범주형 변수는 더미변수(0/1)로 변환되어 기준 범주 대비 효과로 해석된다.
- 4번: 단위가 다른 변수 간 계수 크기 비교는 부적절하므로 옳지 않다.
보충 개념 더미변수는 범주가 k개일 때 k−1개를 생성하며, 변수 중요도 비교에는 표준화 계수·t값·부분 결정계수 등을 활용한다.