문제
다음 중 컬럼의 분산도(Selectivity)와 인덱스 효율성에 대한 설명으로 가장 적절하지 않은 것은?
① 분산도가 높을수록 인덱스 효과가 좋다 ② 분산도 = 1/카디널리티(Cardinality)로 계산한다 ③ 분산도가 낮은 컬럼에 인덱스를 생성하면 비효율적이다 ④ 성별, YES/NO 같은 컬럼은 분산도가 낮다
정답
2번
해설
분산도는 카디널리티/전체 레코드 수로 계산하는 것이 맞습니다. ②번에서 제시한 '1/카디널리티'는 중복도(Density)의 계산식입니다. ①은 맞습니다(분산도가 높을수록 고유값 비율이 높아 인덱스 효과가 좋음). ③도 맞습니다(분산도가 낮으면 중복값이 많아 인덱스 생성이 비효율적). ④도 맞습니다(성별, YES/NO는 카디널리티가 2이고, 전체 레코드 수가 많다면 분산도는 2/전체 레코드 수로 매우 낮음).