문제
다음 중 군집분석 기법에 대한 설명으로 적절하지 않은 것은?
① DBSCAN은 밀도 기반 군집화 방식으로 초기 중심값 설정이 불필요하다. ② 가우시안 혼합 모델(GMM)은 EM 알고리즘을 사용하여 모델 매개변수를 추정하며, 초기 중심값 설정에 따라 그 결과가 달라질 수 있다. ③ 자기 조직화 지도(SOM)는 비지도 학습으로 차원축소와 군집화를 동시에 수행한다. ④ 자기 조직화 지도(SOM)는 모든 입력 노드에 동일한 수의 데이터가 할당된다.
정답
4번
해설
정답: 4. SOM의 각 노드(뉴런)에 할당되는 데이터 수는 데이터 분포에 따라 달라지며, 모든 노드에 동일한 수가 할당된다는 보장은 없다.
오답 풀이
- 1번: DBSCAN은 밀도 임계값(eps, minPts)으로 군집을 형성하므로 초기 중심이 필요 없다.
- 2번: GMM은 EM으로 추정하며 초기값에 따라 국소해가 달라질 수 있다.
- 3번: SOM은 고차원 데이터를 저차원 격자에 사상하여 차원축소와 군집화를 함께 수행한다.
- 4번: 노드별 데이터 할당 수는 균등하지 않으므로 옳지 않다.
보충 개념 SOM은 경쟁 학습으로 승자 노드와 이웃 노드의 가중치를 갱신하며, 입력 공간의 위상(topology)을 보존하는 특징이 있다.