문제
최장연결법을 이용한 군집분석 수행 결과에 대한 설명으로 옳지 않은 것은?
① 군집 간 거리는 가장 멀리 떨어진 개체들의 거리를 기준으로 한다. ② 군집 간 거리가 최소인 군집들을 순차적으로 합치면서 계층 구조를 형성한다. ③ 군집분석은 재분석 시 결과가 달라질 수 있다. ④ 이상치에 민감하며, 군집 간 거리가 이상치에 크게 영향을 받을 수 있다.
정답
3번
해설
정답: 3. 최장연결법 등 계층적 군집분석은 거리 행렬에 따라 결정적으로 수행되므로 동일 데이터로 재분석하면 항상 같은 결과가 나온다(초기값에 따라 달라지는 K-Means와 구분).
오답 풀이
- 1번: 최장연결법(완전연결법)은 두 군집에서 가장 먼 개체 쌍의 거리를 군집 간 거리로 정의한다.
- 2번: 계층적 군집은 거리가 가장 가까운 군집 쌍부터 순차적으로 병합한다.
- 3번: 계층적 군집은 결정적 알고리즘이므로 재분석 시 결과가 달라진다는 설명은 옳지 않다.
- 4번: 최대 거리를 기준으로 하므로 이상치의 영향에 민감하다.
보충 개념 계층적 군집 연결법 — 최단연결법(최소 거리), 최장연결법(최대 거리), 평균연결법, 중심연결법, 와드연결법(SSE 증가 최소).