문제
대용량 로그 데이터 처리를 위한 파티셔닝 전략 수립 시, 다음 중 가장 부적절한 접근 방법은?
① Range 파티셔닝으로 월별 분할 후, 각 파티션 내에서 Hash 서브파티셔닝을 적용하여 부하 분산 ② List 파티셔닝으로 중요도별 분할 후, 자주 조회되지 않는 파티션은 압축 저장소로 이관 ③ Hash 파티셔닝으로 균등 분산 후, 모든 파티션에 동일한 인덱스 구조를 강제 적용 ④ Composite 파티셔닝에서 시간(Range) + 지역(List) 조합으로 분할하되, 각 조합별로 독립적인 백업 정책 수립
정답
3번
해설
③번이 부적절한 방법입니다. Hash 파티셔닝으로 데이터를 균등 분산했더라도, 각 파티션의 데이터 특성이나 접근 패턴이 다를 수 있으므로 모든 파티션에 동일한 인덱스 구조를 강제하는 것은 비효율적입니다. 파티션별 최적화된 인덱스 전략이 필요합니다. ①Range+Hash 조합은 시간 기준 분할과 부하 분산을 동시에 달성합니다. ②List 파티셔닝과 계층화 저장은 데이터 생명주기 관리에 효과적입니다. ④Composite 파티셔닝과 독립 백업 정책은 복합 조건 최적화에 적합합니다.