문제
다음 중 연속형 변수 간 유사성 또는 거리를 측정하는 방법으로 적절하지 않은 것은?
① 마할라노비스 거리 ② 유클리드 거리 ③ 체비셰프 거리 ④ 자카드 거리
정답
4번
해설
정답: 4. 자카드 거리는 주로 집합·이진형 데이터의 유사도 측정에 사용되며, 일반적인 연속형 변수 거리로는 적절하지 않다.
오답 풀이
- 1번: 마할라노비스 거리는 변수 간 공분산 구조를 고려한 거리이다.
- 2번: 유클리드 거리는 연속형 변수의 대표적 거리이다.
- 3번: 체비셰프 거리는 좌표별 차이 중 최댓값을 거리로 사용한다.
- 4번: 자카드 거리는 두 집합의 교집합·합집합으로 정의된다.