문제
아래 품목별 거래 건수 테이블에서 연관규칙 A → B의 신뢰도는?
| 품목 | 구매건수 | 품목 | 구매건수 |
|---|---|---|---|
| A | 100 | A, D | 50 |
| B | 50 | A, B, C | 200 |
| C | 150 | A, B, C, D | 100 |
| A, C | 150 | B, C, D | 100 |
① 40% ② 50% ③ 60% ④ 65%
정답
2번
해설
정답: 2. A를 포함한 거래 = 100 + 150 + 50 + 200 + 100 = 600건, A와 B를 동시에 포함한 거래 = 200 + 100 = 300건이다. 신뢰도(A→B) = 300/600 = 50%이다.
오답 풀이
- 1번: 40%는 분모를 잘못 집계한 값이다.
- 3번: 60%는 A 단독 거래(100)를 분모에서 누락한 계산이다.
- 4번: 65%는 잘못된 조합의 계산이다.
보충 개념 신뢰도(A→B) = P(A∩B)/P(A) = (A·B 동시 포함 거래 수)/(A 포함 거래 수). 품목 집합에 A가 들어간 모든 행을 빠짐없이 집계하는 것이 핵심이다.