SQLD데이터 모델과 SQL성능 데이터 모델링난이도 1MCQ

SQLD 성능 데이터 모델링 기출문제 #194

문제

다음 중 컬럼의 분산도(Selectivity)와 인덱스 효율성에 대한 설명으로 가장 적절하지 않은 것은?

① 분산도가 높을수록 인덱스 효과가 좋다 ② 분산도 = 1/카디널리티(Cardinality)로 계산한다 ③ 분산도가 낮은 컬럼에 인덱스를 생성하면 비효율적이다 ④ 성별, YES/NO 같은 컬럼은 분산도가 낮다

정답

2

해설

분산도는 카디널리티/전체 레코드 수로 계산하는 것이 맞습니다. ②번에서 제시한 '1/카디널리티'는 중복도(Density)의 계산식입니다. ①은 맞습니다(분산도가 높을수록 고유값 비율이 높아 인덱스 효과가 좋음). ③도 맞습니다(분산도가 낮으면 중복값이 많아 인덱스 생성이 비효율적). ④도 맞습니다(성별, YES/NO는 카디널리티가 2이고, 전체 레코드 수가 많다면 분산도는 2/전체 레코드 수로 매우 낮음).

이런 문제 20~50개를 한 번에 풀어보세요

매번 새로 추가되는 모의고사 + 오답 자동 복습 + 회차별 실력 추적. 회원가입 후 무료 이용.

[SQLD] 성능 데이터 모델링 데이터 모델과 SQL 기출 #194 | sqldpass