문제
잔고(Balance)와 수입(Income)이 신용카드 연체(Default) 여부에 미치는 영향을 로지스틱 회귀분석한 결과이다. 해석으로 옳지 않은 것은?
| 변수 | 회귀계수 | 표준오차 | p-value |
|---|---|---|---|
| (Intercept) | -11.5405 | 0.4350 | <0.001 |
| Balance | 0.0056 | 0.0002 | <0.001 |
| Income | 0.00003 | 0.00008 | 0.712 |
① Balance가 증가할수록 연체 확률은 높아지는 경향이 있다. ② Balance의 회귀계수는 유의수준 0.05에서 통계적으로 유의하다. ③ Income은 유의수준 0.05에서 연체 여부에 유의한 영향을 준다고 보기 어렵다. ④ Balance가 1 증가하면 연체 확률이 0.56%p 증가한다.
정답
4번
해설
정답: 4. 로지스틱 회귀에서 회귀계수는 확률이 아니라 로그 오즈(log-odds)의 변화량이다. Balance가 1 증가하면 연체의 로그 오즈가 0.0056 증가하는 것이며, 확률이 일정하게 0.56%p 증가하는 것이 아니다.
오답 풀이
- 1번: Balance의 계수가 양수이므로 잔고가 클수록 연체 확률이 높아지는 경향이다.
- 2번: Balance의 p-value < 0.001 < 0.05이므로 유의하다.
- 3번: Income의 p-value 0.712 > 0.05이므로 유의하다고 보기 어렵다.
- 4번: 계수를 확률 변화로 직접 해석했으므로 옳지 않다.
보충 개념 로지스틱 회귀에서 exp(계수)는 오즈비(odds ratio)를 의미하며, 확률 변화량은 기준 확률 수준에 따라 달라진다.