왜 3일이 아니라 7일이어야 하는가
3일 플랜은 이미 별도 글로 정리했어요. 그런데 그 글에서도 결국 "비전공자라면 5–7일 권장"이라고 적었습니다. 이유는 단순합니다.
ADsP 3과목(데이터 분석)은 통계·머신러닝 평가지표가 핵심인데, 이게 처음 보는 사람한테는 그냥 외운다고 안 들어와요. 정밀도·재현율·F1 같은 개념은 한 번 헷갈리기 시작하면 시험장에서 4지선다 두 개 사이에서 계속 망설입니다. 7일이면 이 개념을 두 번 보고 갈 수 있어서, 같은 문제도 망설이는 시간이 줄어듭니다.
이 글은 3일 플랜이 빡빡한 사람, 또는 처음부터 안정적으로 가고 싶은 사람을 위한 7일 루트입니다.
ADsP 합격 기준 다시 한번
| 항목 | 내용 |
|---|---|
| 문항 | 50문항 객관식 |
| 시간 | 90분 |
| 합격선 | 평균 60점 + 과목별 40점 (과락 방어) |
| 과목 | 1과목 데이터 이해 (10) / 2과목 분석 기획 (10) / 3과목 데이터 분석 (30) |
50문항 중 3과목이 30문항입니다. 이 한 줄이 7일 플랜의 모든 우선순위를 결정해요. 3과목에서 18개(60%) 맞추면 합격이 거의 확정입니다.
7일 플랜 한눈에
| 일차 | 목표 | 시간 |
|---|---|---|
| 1일차 | 기출 1회 + 점수 진단 | 3시간 |
| 2일차 | 1과목 용어 + 빅데이터 5V | 3시간 |
| 3일차 | 3과목 통계 기초 (평균·분산·상관) | 4시간 |
| 4일차 | 3과목 회귀·분류 + 평가지표 | 5시간 |
| 5일차 | 3과목 군집·시계열·R 기초 | 4–5시간 |
| 6일차 | 2과목 기획 + 모의고사 1회 | 4시간 |
| 7일차 | 모의고사 2회 + 오답 마무리 | 4–5시간 |
1일차 — 진단 (시간 짧음, 마음만 잡으면 됨)
벼락치기에서 1일차는 공부보다 현재 위치 측정입니다.
진행 (3시간)
- 최근 회차 기출 1회 시간 재고 풀기 (90분)
- 채점 + 과목별 점수 기록 (15분)
- 오답 해설 정독 (60분)
- 약점 주제 단어로 정리 (15분)
진단 결과를 다음 표에 적어두세요. 7일 내내 우선순위 기준이 됩니다.
| 과목 | 점수 | 위험도 |
|---|---|---|
| 1과목 (10) | __ / 10 | __ |
| 2과목 (10) | __ / 10 | __ |
| 3과목 (30) | __ / 30 | __ |
3과목 점수가 12점 미만이면 그 과목에 6일을 다 써야 한다는 뜻입니다.
2일차 — 1과목 (가장 빠르게 점수 회수)
1과목은 용어 암기 위주라서 하루 만에 7–8개는 맞출 수 있게 됩니다.
핵심 용어
- DIKW 피라미드: Data → Information → Knowledge → Wisdom
- 데이터 유형: 정형(테이블)·반정형(JSON·XML)·비정형(텍스트·이미지)
- 빅데이터 5V: Volume, Velocity, Variety, Veracity, Value
- 데이터베이스 vs DW vs Data Lake 차이
- 개인정보 비식별화: 가명처리·총계처리·데이터 삭제·범주화·마스킹
진행 (3시간)
- 핵심 용어 노트 정리 (1.5시간)
- 1과목 기출 1회 풀기 (1시간)
- 틀린 용어 다시 보기 (30분)
이 시점에 1과목에서 7개 이상 맞으면 7일차까지 추가 학습은 안 해도 됩니다.
3일차 — 3과목 통계 기초 (개념 익숙해지기)
3일차부터 5일차까지는 3과목에 몰빵합니다. 가장 헷갈리는 통계 개념을 먼저 보고, 그 위에 회귀·분류를 올리는 순서예요.
기본 통계량
- 평균: 합 / 개수
- 분산: 평균에서의 거리² 평균
- 표준편차: 분산의 √
- 중앙값·최빈값: 정렬 후 가운데 / 가장 자주 등장
- 사분위수: Q1·Q2·Q3·IQR (Q3-Q1)
상관·공분산
- 상관계수: -1 ~ 1, 절댓값 클수록 강한 관계
- 공분산: 부호로 방향만 (값 자체는 단위에 의존)
- 0이면 선형 관계 없음 (비선형 관계는 있을 수 있음)
가설검정 (개념만)
- 귀무가설(H0) vs 대립가설(H1)
- p-value < 유의수준(0.05)이면 H0 기각
- 1종 오류(α) vs 2종 오류(β)
4일차 — 3과목 회귀·분류 + 평가지표 (가장 중요한 하루)
ADsP 3과목 출제의 절반은 이 영역입니다. 5시간 통째로 비우세요.
회귀 분석
- 단순 선형 회귀: y = ax + b
- 다중 선형 회귀: 독립변수 여러 개
- 회귀 4가지 가정: 선형성·독립성·등분산성·정규성 (선·독·등·정)
- 결정계수 R²: 0~1, 클수록 설명력 좋음
- MSE / RMSE / MAE: 작을수록 좋음
분류 모델
- 로지스틱 회귀: 이름은 회귀지만 분류
- 의사결정나무: 지니지수·엔트로피로 분기 결정
- 가지치기(Pruning): 과적합 방지
- 랜덤 포레스트: 의사결정나무 여러 개 앙상블
- SVM: 마진 최대화 분류기
분류 평가지표 (매회 3–4문제)
혼동행렬:
| 예측 양성 | 예측 음성 | |
|---|---|---|
| 실제 양성 | TP | FN |
| 실제 음성 | FP | TN |
- 정확도(Accuracy): (TP+TN) / 전체
- 정밀도(Precision): TP / (TP+FP) — 예측 양성 중 진짜 양성
- 재현율(Recall): TP / (TP+FN) — 진짜 양성 중 잘 잡은 비율
- F1 Score: 정밀도와 재현율의 조화평균
- 특이도(Specificity): TN / (TN+FP)
5일차 — 군집·시계열·R 기초
3과목 후반부와 R 코드 기본을 한 번에 봅니다.
군집 분석
- K-means: K 사전 지정, 초기값에 민감
- 계층적 군집: 덴드로그램 시각화
- DBSCAN: 밀도 기반, K 지정 불필요
- 실루엣 계수: 군집 평가 (-1 ~ 1, 클수록 좋음)
시계열 분석
- 4요소: 추세·계절성·순환·불규칙
- 이동평균: 단순·가중·지수
- 자기상관함수(ACF): 시차 간 상관
R 기초 (3–4문제)
- 변수 할당:
x <- 5또는x = 5 - 벡터 생성:
c(1, 2, 3) - 데이터프레임:
data.frame(x=1:3, y=c('a','b','c')) - 패키지:
install.packages()/library() - 결측치:
is.na()/na.rm=TRUE - 자주 나오는 함수:
mean()var()sd()cor()lm()
6일차 — 2과목 + 첫 모의고사
2과목은 가장 마지막에 봐도 됩니다. 암기 위주라 단기간에 들어가요.
오전 (2시간) — 2과목 핵심
- 분석 과제 발굴: 하향식(Top-down) vs 상향식(Bottom-up)
- 분석 성숙도 4단계: 도입 → 활용 → 확산 → 최적화
- 분석 거버넌스 구성요소: 조직·인력·프로세스·기술·데이터
- CRISP-DM 6단계: 업무 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 전개
오후 (2시간) — 모의고사 1회
- 시간 재고 90분
- 채점 + 과목별 점수 확인
- 평균 60점 이상이면 7일차 가볍게 진행
- 미만이면 7일차 약점 과목 추가 학습
7일차 — 마무리
새 개념 보지 마세요.
오전 (2시간) — 모의고사 2회 (다른 회차)
- 평균 65점 이상 나오면 안정권
오후 (2시간) — 오답 정리
- 6·7일차 모의고사 틀린 문제만 다시 보기
- 정밀도·재현율·F1 같은 헷갈리는 지표는 카드로 만들어 시험장 가는 길에 한 번 더
저녁 — 일찍 자기
3일 플랜 vs 7일 플랜 — 어느 쪽을 골라야 하나
| 기준 | 3일 플랜 | 7일 플랜 |
|---|---|---|
| 통계 배경 | 통계 수업 들어본 적 있음 | 통계 처음 또는 흐릿함 |
| 평일 가능 시간 | 풀타임 (휴가·주말) | 평일 2–3시간 + 주말 |
| 목표 점수 | 합격선 60점 | 안정권 65–70점 |
| 마음 여유 | 빡빡함, 카페인 필요 | 적당히 분배 가능 |
| 위험도 | 한 번 무너지면 회복 어려움 | 하루 미스해도 복구 가능 |
3일 플랜은 후기로 합격 사례가 많지만, 사실상 연차·주말 풀로 비울 수 있는 사람이 진입하는 루트입니다. 그게 안 되면 7일 잡고 평일 분산이 훨씬 안전해요.
시험 당일 — 시간 배분
90분 × 50문항 = 1문항당 1.8분. 여유는 있는 편입니다.
- 1과목 → 2과목 → 3과목 순서 (쉬운 것부터 점수 확보)
- 3과목 계산 문제는 마지막에 — 시간 보호 우선
- 30분 지났을 때 중간 체크 — 1·2과목 다 풀었는지
- 모르면 찍기 — 빈칸 금지. 4지선다라 기대값 25%
- 마지막 10분 검토 — 헷갈렸던 문제 위주로
정리
- 1주 벼락치기는 3과목(데이터 분석)에 4·5·6일차를 통째로 투자
- 정밀도·재현율·F1·R²는 시험장에서 가장 자주 헷갈리는 개념 — 7일이면 두 번 볼 시간 있음
- 1과목·2과목은 합쳐서 2일이면 충분
- R은 코드 작성보다 함수 의미 위주