결론 먼저
ADsP 2과목은 10문항밖에 안 돼서 가볍게 보기 쉬운데, 과락 기준이 4문제라 버리면 위험해요. 2과목은 분석 과제 발굴(하향식·상향식) + 분석 성숙도 4단계 + 데이터 거버넌스 이 3덩어리만 잡으면 과락 방어 + 6–7개 확보가 가능합니다.
왜 2과목이 의외로 까다로운가
1과목(데이터 이해)은 DIKW·빅데이터 5V 같은 그림이 있는 개념이 많아서 직관적이에요. 3과목(분석)은 통계라서 난이도는 있지만 계산·해석 방식. 그런데 2과목은 순수 암기인데 용어가 비슷비슷해서 헷갈려요.
"하향식 vs 상향식", "분석 성숙도 4단계", "CRISP-DM 6단계" 같은 게 보기에 섞여 나오면 무엇이 무엇인지 구분이 안 되는 거죠. 그래서 용어 하나당 한 줄씩 정확히 매칭해두는 게 전략입니다.
분석 과제 발굴 — 하향식 vs 상향식
하향식 접근 (Top-Down)
문제 → 해결 방법 탐색.
- 문제 탐색 (Problem Discovery): 비즈니스 문제를 먼저 식별
- 문제 정의 (Problem Definition): 데이터 관점으로 재정의
- 해결 방안 탐색: 가능한 분석 접근법 고려
- 타당성 검토: 경제성·기술성 평가
특징: 명확한 문제가 이미 있을 때 사용.
상향식 접근 (Bottom-Up)
데이터 → 패턴 발견 → 문제 도출.
- 비정형·다양한 데이터 탐색
- 시행착오를 통한 문제 해결 (프로토타이핑)
- 데이터에서 의미 있는 패턴 발굴
특징: 문제가 명확하지 않은 상태에서 데이터부터 출발.
"하향식은 문제부터, 상향식은 데이터부터"라는 한 줄만 외우면 80%는 커버돼요.분석 방법론 — CRISP-DM 6단계
표준 데이터 마이닝 방법론.
| 단계 | 내용 |
|---|---|
| 1. 업무 이해 | 비즈니스 목표 정의 |
| 2. 데이터 이해 | 데이터 수집·탐색 |
| 3. 데이터 준비 | 전처리·변환 |
| 4. 모델링 | 알고리즘 적용 |
| 5. 평가 | 모델 성능·비즈니스 검증 |
| 6. 전개 | 실제 배포·운영 |
비슷한 방법론: KDD(5단계) — Selection → Preprocessing → Transformation → Data Mining → Interpretation.
두 방법론 중 어느 것이 몇 단계인지 묻는 단답 문제 자주 나와요.
분석 성숙도 모델 4단계
조직의 데이터 분석 역량 수준.
| 단계 | 이름 | 특징 |
|---|---|---|
| 1 | 도입 | 분석 시작, 비정기적 |
| 2 | 활용 | 일부 부서에서 정기 활용 |
| 3 | 확산 | 전사적 분석 체계 구축 |
| 4 | 최적화 | 분석이 전략 의사결정의 중심 |
분석 수준 진단 — 준비형/정착형/확산형/최적화형
성숙도(역량) × 준비도(인프라)의 2×2 매트릭스로 조직 유형을 나눔.
- 준비형: 역량·준비도 모두 낮음 (초기)
- 정착형: 역량 있으나 준비도 낮음
- 확산형: 준비도 있으나 역량 낮음
- 최적화형: 둘 다 높음 (이상)
데이터 거버넌스
데이터를 조직적·체계적으로 관리하는 체계.
3대 구성 요소
- 원칙 (Principle): 데이터 관리 정책·지침
- 조직 (Organization): 데이터 관리자·관리 조직
- 프로세스 (Process): 데이터 품질·보안 관리 절차
데이터 품질 6가지 기준
- 정확성, 완전성, 일관성, 적시성, 유효성, 접근성
품질 기준 이름을 묻는 문제 자주 나옵니다.
메타데이터 관리
- 기술 메타데이터: 데이터 구조·타입·크기
- 업무 메타데이터: 비즈니스 의미·용어
- 운영 메타데이터: 접근 권한·이력
분석 과제 관리 — 5가지 영역
ADsP에 자주 나오는 프레임.
- 데이터: 분석 대상 데이터
- 분석 모형: 사용할 알고리즘·기법
- 분석 결과 활용: 결과를 어디에 쓸지
- 변화 관리: 분석 도입 시 조직 변화
- 교육 및 활용: 인력 역량 강화
자주 하는 실수
1. CRISP-DM 6단계와 KDD 5단계 혼동
- CRISP-DM = 6단계 (비즈니스 이해부터 시작)
- KDD = 5단계 (선택부터 시작)
- 이름으로 구분: CRISP는 비즈니스 중심, KDD는 데이터 중심
2. 분석 성숙도와 준비도 진단 헷갈림
- 성숙도: 4단계 (도입 → 활용 → 확산 → 최적화)
- 진단 유형: 4가지 매트릭스 (준비·정착·확산·최적화형)
3. 데이터 거버넌스 3요소 암기 오류 원칙-조직-프로세스 (POP 아니고 P·O·P). 보기에 "사람"이 있으면 함정.
4. 하향식/상향식 순서 오해
- 하향식 4단계: 문제 탐색 → 정의 → 해결방안 → 타당성
- 상향식 특징: 프로토타이핑·시행착오
시험장에서의 접근법
- 개념 이름만 정확히 매칭되면 대부분 풀림 — 깊이 이해할 필요 없음
- 단계 수 묻는 문제는 숫자 자체를 외워둔 상태여야 함
- 헷갈리는 쌍(하향/상향, 성숙도/진단)이 보기에 섞여 나오면 주의
- 10문항밖에 안 되니 한 문제에 1분 이상 쓰지 말기
정리
- 하향식(문제→데이터) vs 상향식(데이터→문제)
- CRISP-DM 6단계, KDD 5단계
- 분석 성숙도: 도입·활용·확산·최적화
- 거버넌스: 원칙·조직·프로세스 (POP)
- 품질 6기준: 정확·완전·일관·적시·유효·접근