📝 기출문제 전체 보기
데이터분석 준전문가(ADsP) 2025년 44회차 기출 복원입니다. 각 문제 아래의 「정답·해설 보기」를 펼치면 정답과 해설이 나타나요. 실전 시험 환경(타이머·자동 채점·오답 누적)에서 풀어보고 싶다면 글 맨 아래 「직접 풀러가기」를 눌러주세요.
문제 1
4지선다다음 중 데이터 분석가에 대한 설명으로 가장 부적절한 것은?
- 1.특정 도메인의 전문가가 직접 분석에 참여하면 더 깊은 통찰을 얻을 수 있다.
- 2.분석가는 분석 업무와 관리 업무를 동시에 수행할 수 없다.
- 3.분석가는 커뮤니케이션 능력과 팀워크 같은 소프트 스킬도 갖추면 좋다.
- 4.분석가는 일반적으로 코딩만 수행하는 역할로 한정되지 않는다.
정답·해설 보기▾
정답
2번. 분석가는 분석 업무와 관리 업무를 동시에 수행할 수 없다.
해설
정답: 2. 데이터 분석가는 상황에 따라 분석 업무와 관리 업무를 함께 수행할 수 있으므로 부적절한 설명입니다.
오답 풀이
- 1번: 도메인 지식이 있는 사람이 분석하면 업무 맥락을 반영한 통찰을 얻기 쉽습니다.
- 2번: 분석가가 관리자 역할을 절대 수행할 수 없다는 설명은 지나치게 단정적입니다.
- 3번: 분석 결과를 전달하고 협업하기 위해 소프트 스킬은 중요합니다.
- 4번: 데이터 분석가는 문제 정의·데이터 해석·결과 전달 등 코딩 외 업무도 수행합니다.
보충 개념 데이터 분석가는 기술 역량뿐 아니라 비즈니스 이해·문제 정의·커뮤니케이션 능력을 함께 요구받습니다.
문제 2
4지선다다음 중 전략적 통찰력이 있는 분석에 관한 내용으로 적절하지 않은 것은?
- 1.인사이트를 도출하여 사업 환경 변화에 빠르게 대응하고 새로운 기회를 찾을 수 있다.
- 2.분석을 무조건 많이 수행하는 것 자체가 핵심은 아니다.
- 3.통찰력 있는 분석은 기업의 의사결정에 긍정적인 영향을 줄 수 있다.
- 4.기업 내부 관점에만 한정하여 분석을 수행한다.
정답·해설 보기▾
정답
4번. 기업 내부 관점에만 한정하여 분석을 수행한다.
해설
정답: 4. 전략적 통찰력은 내부 관점뿐 아니라 외부 환경·시장·고객 변화까지 고려해야 하므로 내부 관점에만 국한된다는 설명은 부적절합니다.
오답 풀이
- 1번: 전략적 분석은 환경 변화 대응과 기회 발굴에 도움을 줍니다.
- 2번: 분석의 양보다 문제에 맞는 통찰 도출이 중요합니다.
- 3번: 통찰 있는 분석은 의사결정 품질을 높일 수 있습니다.
- 4번: 내부 관점에만 머무르면 전략적 통찰력이 약해질 수 있습니다.
문제 3
4지선다다음 중 빅데이터 위기에 대한 대응 방안으로 가장 적절하지 않은 것은?
- 1.익명화 기술을 통해 사생활 침해 위험을 줄인다.
- 2.사생활 침해 통제 방안으로 동의제에서 책임제로 전환을 고려한다.
- 3.잠재적 위협 요인만으로 개인에게 불이익을 준다.
- 4.알고리즘 접근을 허용하여 데이터 오용에 따른 피해를 줄인다.
정답·해설 보기▾
정답
3번. 잠재적 위협 요인만으로 개인에게 불이익을 준다.
해설
정답: 3. 잠재적 위협 요인만으로 개인에게 불이익을 주는 것은 빅데이터 위기 중 책임 원칙 훼손에 해당하며, 대응 방안으로 적절하지 않습니다.
오답 풀이
- 1번: 익명화는 개인정보 노출과 사생활 침해 위험을 줄이기 위한 기술적 대응 방안입니다.
- 2번: 동의제에서 책임제로의 전환은 사생활 침해 문제 대응 논의입니다.
- 3번: 예측이나 잠재적 위험만으로 불이익을 주는 것은 책임 원칙을 훼손합니다.
- 4번: 알고리즘 접근 허용은 데이터 오용을 줄이기 위한 투명성 확보 방안입니다.
문제 4
4지선다다음 중 데이터에 대한 설명으로 옳지 않은 것은?
- 1.데이터의 유형에 따라 적합한 분석 방법이 달라질 수 있다.
- 2.HTML 문서는 일반적으로 정형 데이터로 분류된다.
- 3.데이터는 정형, 반정형, 비정형 데이터로 구분할 수 있다.
- 4.이미지와 동영상 데이터는 비정형 데이터에 해당한다.
정답·해설 보기▾
정답
2번. HTML 문서는 일반적으로 정형 데이터로 분류된다.
해설
정답: 2. HTML은 태그 구조를 가지지만 고정된 행과 열 형태의 정형 데이터가 아니라 반정형 데이터로 분류하는 것이 일반적입니다.
오답 풀이
- 1번: 데이터 유형에 따라 분석 방법이 달라집니다.
- 2번: HTML은 관계형 테이블처럼 엄격한 스키마를 갖는 정형 데이터가 아닙니다.
- 3번: 데이터는 보통 정형·반정형·비정형으로 구분합니다.
- 4번: 이미지·동영상은 정해진 행·열 구조가 없어 비정형 데이터입니다.
문제 5
4지선다"커피를 구매하는 사람이 탄산음료도 함께 구매하는 경향이 있는가?"와 같은 관계를 파악하는 데 적합한 분석 방식은?
- 1.유전 알고리즘
- 2.군집 분석
- 3.자연어 분석
- 4.연관분석
정답·해설 보기▾
정답
4번. 연관분석
해설
정답: 4. 상품 간 동시 구매 패턴을 찾는 분석은 연관분석에 해당합니다.
오답 풀이
- 1번: 유전 알고리즘은 최적화 문제 해결에 활용됩니다.
- 2번: 군집 분석은 유사한 대상을 묶는 분석입니다.
- 3번: 자연어 분석은 텍스트 데이터의 의미를 분석하는 기법입니다.
- 4번: 연관분석은 함께 발생하는 항목 간 관계를 찾습니다.
문제 6
4지선다다음 중 업무 영역과 일차원적 분석 사례의 연결이 가장 부적절한 것은?
- 1.마케팅: 신규 지점 입지 선정
- 2.공급처: 공급망 관리 및 재고 관리
- 3.재무관리: 거래처 관리
- 4.인력관리: 이직률 예측
정답·해설 보기▾
정답
3번. 재무관리: 거래처 관리
해설
정답: 3. 거래처 관리는 일반적으로 재무관리보다 영업 또는 고객·거래처 관리 영역에 더 가깝습니다.
오답 풀이
- 1번: 신규 지점 위치 결정은 마케팅 분석 사례입니다.
- 2번: 공급망과 재고 관리는 공급 영역의 분석 사례입니다.
- 3번: 재무관리는 비용·수익성·위험·예산과 더 직접적으로 관련됩니다.
- 4번: 이직률 예측은 인력관리 영역의 분석 사례입니다.
문제 7
4지선다이용자가 원하는 정보를 신속하게 획득하기 위해 우선적으로 고려해야 할 측면은?
- 1.정보관리 측면
- 2.정보기술 발전 측면
- 3.사회경제적 측면
- 4.정보이용 측면
정답·해설 보기▾
정답
4번. 정보이용 측면
해설
정답: 4. 이용자가 원하는 정보를 빠르게 얻는 문제는 정보 활용성·접근성을 중시하는 정보이용 측면과 가장 직접적으로 관련됩니다.
오답 풀이
- 1번: 정보관리 측면은 정보의 저장·관리·품질 유지에 초점을 둡니다.
- 2번: 정보기술 발전 측면은 기술 기반 변화에 초점을 둡니다.
- 3번: 사회경제적 측면은 사회와 경제에 미치는 영향과 관련됩니다.
- 4번: 정보이용 측면은 사용자의 정보 검색·활용에 초점을 둡니다.
문제 8
4지선다1ZB와 동일한 데이터 용량은?
- 1.1024EB
- 2.1024PB
- 3.1024GB
- 4.1024YB
정답·해설 보기▾
정답
1번. 1024EB
해설
정답: 1. 데이터 용량 단위는 GB → TB → PB → EB → ZB → YB 순서로 1024배씩 커지므로 1ZB = 1024EB입니다.
오답 풀이
- 1번: 1ZB = 1024EB로 맞습니다.
- 2번: 1024PB = 1EB입니다.
- 3번: 1024GB = 1TB입니다.
- 4번: 1024YB는 ZB보다 훨씬 큰 단위입니다.
문제 9
4지선다다음 중 데이터 사이언스에 대한 설명으로 가장 부적절한 것은?
- 1.생성된 데이터를 바탕으로 데이터베이스를 구축하는 것 자체가 데이터 사이언스의 핵심 목적이다.
- 2.분석뿐 아니라 결과를 설명하고 전달하는 과정도 포함한다.
- 3.통계학, 기계학습, 데이터마이닝 기법 등을 활용한다.
- 4.데이터를 이용하여 정보와 인사이트를 만들어낸다.
정답·해설 보기▾
정답
1번. 생성된 데이터를 바탕으로 데이터베이스를 구축하는 것 자체가 데이터 사이언스의 핵심 목적이다.
해설
정답: 1. 데이터베이스 구축은 데이터 관리 영역에 가깝고, 데이터 사이언스의 핵심은 데이터에서 인사이트와 가치를 도출하는 것입니다.
오답 풀이
- 1번: DB 구축이 데이터 사이언스 자체의 핵심 정의는 아닙니다.
- 2번: 데이터 사이언스는 분석 결과의 설명과 전달까지 포함합니다.
- 3번: 통계학·기계학습·데이터마이닝은 데이터 사이언스의 주요 기법입니다.
- 4번: 데이터에서 정보·인사이트를 도출하는 것이 데이터 사이언스의 목적입니다.
문제 10
4지선다기온 변화에 따른 판매량 변화를 예측하는 데 가장 적합한 분석 방법은?
- 1.회귀분석
- 2.연관분석
- 3.군집분석
- 4.유전 알고리즘
정답·해설 보기▾
정답
1번. 회귀분석
해설
정답: 1. 기온이라는 독립변수가 판매량(종속변수)에 미치는 영향을 예측하는 문제는 회귀분석에 적합합니다.
오답 풀이
- 1번: 회귀분석은 변수 간 관계 모델링과 예측에 사용됩니다.
- 2번: 연관분석은 함께 발생하는 항목 간 관계를 찾는 기법입니다.
- 3번: 군집분석은 유사한 대상을 묶는 비지도 학습 기법입니다.
- 4번: 유전 알고리즘은 최적화 문제에 활용됩니다.
문제 11
4지선다분석 마스터플랜 수립 시 최우선 순위로 고려할 과제 유형은?
- 1.난이도는 낮고 시급성은 미래인 과제
- 2.난이도는 낮고 시급성은 현재인 과제
- 3.난이도는 높고 시급성은 미래인 과제
- 4.난이도는 높고 시급성은 현재인 과제
정답·해설 보기▾
정답
2번. 난이도는 낮고 시급성은 현재인 과제
해설
정답: 2. 난이도가 낮고 현재 시급성이 높은 과제는 빠르게 성과를 낼 수 있어 우선 추진 대상으로 적합합니다.
오답 풀이
- 1번: 미래 과제이므로 현재 최우선이 아닙니다.
- 2번: 쉬우면서 현재 시급한 과제는 빠른 실행과 성과 도출이 가능합니다.
- 3번: 어렵고 미래 과제는 장기 검토 대상에 가깝습니다.
- 4번: 현재 시급하지만 난이도가 높아 즉시 성과 어렵습니다.
문제 12
4지선다다음 중 분석 기획 시 고려사항으로 가장 부적절한 것은?
- 1.가치창출 시나리오와 유즈케이스 탐색
- 2.장애요소와 대응방안 검토
- 3.데이터 정합성에 대한 검토
- 4.데이터 유형은 분석 기획 단계에서 고려하지 않아도 된다.
정답·해설 보기▾
정답
4번. 데이터 유형은 분석 기획 단계에서 고려하지 않아도 된다.
해설
정답: 4. 데이터 유형은 분석 방법·처리 방식·모델링에 영향을 주므로 분석 기획 단계에서 반드시 고려해야 합니다.
오답 풀이
- 1번: 가치 시나리오와 유즈케이스 검토는 필수입니다.
- 2번: 장애요소·대응방안을 사전에 고려해야 합니다.
- 3번: 데이터 정합성은 분석 결과 신뢰도와 직결됩니다.
- 4번: 데이터 유형은 분석 기획에서 반드시 고려해야 합니다.
문제 13
4지선다다음 중 과제 중심적 데이터 분석에 대한 설명으로 옳지 않은 것은?
- 1.즉각적인 실행을 통해 성과를 도출하는 데 초점을 둔다.
- 2.속도와 검증을 중시한다.
- 3.빠른 문제 해결을 목표로 한다.
- 4.이행 과제 분석에서 선후관계를 고려하지 않는다.
정답·해설 보기▾
정답
4번. 이행 과제 분석에서 선후관계를 고려하지 않는다.
해설
정답: 4. 과제 중심적 분석이라도 실제 이행 과정에서는 과제 간 선후관계와 의존성을 고려해야 합니다.
오답 풀이
- 1번: 빠른 실행과 성과 도출에 초점을 둡니다.
- 2번: 가설 빠른 검증과 성과 확인이 중요합니다.
- 3번: 특정 문제를 빠르게 해결하는 성격이 강합니다.
- 4번: 선후관계 무시는 실행 가능성·효과를 떨어뜨립니다.
문제 14
4지선다다음 중 데이터 분석 거버넌스와 직접적인 관련이 가장 낮은 것은?
- 1.분석 비용
- 2.분석 프로세스
- 3.분석 조직
- 4.개별 분석 기법
정답·해설 보기▾
정답
4번. 개별 분석 기법
해설
정답: 4. 거버넌스는 조직·프로세스·정책·역할·비용 관리 등 관리 체계에 초점을 두며, 개별 분석 기법 자체와는 상대적으로 관련이 낮습니다.
오답 풀이
- 1번: 분석 비용 관리는 거버넌스 체계에서 고려됩니다.
- 2번: 표준화된 분석 프로세스는 거버넌스의 핵심 요소입니다.
- 3번: 분석 조직과 역할 정의는 거버넌스와 직접 관련됩니다.
- 4번: 분석 기법은 실제 분석 수행 방법으로 거버넌스 핵심이 아닙니다.
문제 15
4지선다빅데이터 분석 프로세스의 순서로 가장 적절한 것은?
- 1.분석기획 → 비즈니스 이해 → 데이터 분석 → 시스템 구현 → 평가 및 전개
- 2.비즈니스 이해 → 분석기획 → 데이터 분석 → 시스템 구현 → 평가 및 전개
- 3.데이터 준비 → 분석기획 → 데이터 분석 → 시스템 구현 → 평가 및 전개
- 4.분석기획 → 데이터 준비 → 데이터 분석 → 시스템 구현 → 평가 및 전개
정답·해설 보기▾
정답
4번. 분석기획 → 데이터 준비 → 데이터 분석 → 시스템 구현 → 평가 및 전개
해설
정답: 4. ADsP 표준 빅데이터 분석 방법론은 분석기획 → 데이터 준비 → 데이터 분석 → 시스템 구현 → 평가 및 전개의 5단계입니다.
오답 풀이
- 1번: 비즈니스 이해는 분석기획의 하위 활동으로 별도 단계가 아닙니다.
- 2번: 표준 5단계와 다른 순서입니다.
- 3번: 데이터 준비는 분석기획 이후 수행되어야 합니다.
- 4번: 표준 5단계 순서입니다.
문제 16
4지선다다음 중 빅데이터의 가치 측정이 어려운 이유로 부적절한 것은?
- 1.데이터가 언제, 누가, 어디에서 사용되었는지 특정하기 어려울 수 있다.
- 2.데이터 전문가가 많아지면 데이터 분석이 보편화되기 때문이다.
- 3.기존에는 없던 분석 방식으로 새로운 가치가 창출될 수 있다.
- 4.데이터 재조합과 매시업이 빈번하게 발생한다.
정답·해설 보기▾
정답
2번. 데이터 전문가가 많아지면 데이터 분석이 보편화되기 때문이다.
해설
정답: 2. 데이터 전문가가 많아져 분석이 보편화된다는 설명은 빅데이터 가치 측정이 어려운 직접적인 이유로 보기 어렵습니다.
오답 풀이
- 1번: 사용 맥락이 다양하면 가치 산정이 어렵습니다.
- 2번: 전문가 증가는 가치 측정 어려움과 직접 관련이 약합니다.
- 3번: 새로운 분석 방식은 예측 어려운 가치를 만들어 측정이 어렵습니다.
- 4번: 재조합되면 원천 데이터의 기여 가치를 구분하기 어렵습니다.
문제 17
4지선다CMMI 모델 기반 분석 성숙도 단계 중 도입 단계에 해당하는 것은?
- 1.경영진 주도로 분석을 전략적으로 활용한다.
- 2.실적 분석과 통계 작성을 수행한다.
- 3.데이터를 활용해 미래를 예측한다.
- 4.성과를 실시간으로 분석한다.
정답·해설 보기▾
정답
2번. 실적 분석과 통계 작성을 수행한다.
해설
정답: 2. 도입 단계는 기본적인 실적 분석과 통계 작성 수준의 분석 활동이 이루어지는 단계입니다.
오답 풀이
- 1번: 경영진 주도 전략적 활용은 더 높은 성숙도(확산/최적화) 단계입니다.
- 2번: 실적 분석·통계 작성은 도입 단계의 대표적 모습입니다.
- 3번: 미래 예측은 활용/확산 단계에서 나타납니다.
- 4번: 실시간 성과 분석은 최적화 단계에 가깝습니다.
문제 18
4지선다하향식 접근법에서 비즈니스 모델 기반 분석 기회 발굴 절차로 올바른 것은?
- 1.프로세스 분류 → 프로세스 흐름분석 → 분석요건 식별 → 분석요건 정의
- 2.프로세스 흐름분석 → 분석요건 식별 → 분석요건 정의 → 프로세스 분류
- 3.분석요건 식별 → 분석요건 정의 → 프로세스 분류 → 프로세스 흐름분석
- 4.분석요건 식별 → 분석요건 정의 → 프로세스 흐름분석 → 프로세스 분류
정답·해설 보기▾
정답
1번. 프로세스 분류 → 프로세스 흐름분석 → 분석요건 식별 → 분석요건 정의
해설
정답: 1. 업무 프로세스를 분류하고 흐름을 분석한 뒤 분석요건을 식별·정의하는 순서가 적절합니다.
오답 풀이
- 1번: 프로세스 기반으로 접근해 분석요건을 도출하는 자연스러운 흐름입니다.
- 2번: 프로세스 분류가 마지막에 배치되어 부적절합니다.
- 3번: 분석요건 정의 후 프로세스 분류는 적절한 흐름이 아닙니다.
- 4번: 흐름분석과 분류 순서가 뒤바뀌었습니다.
문제 19
4지선다상향식 접근법의 특징으로 올바른 것만 고른 것은?
<보기> a. 인사이트와 지식을 얻는 Bottom-Up 접근방법이다. b. 이전 단계가 완성되어야만 다음 단계로 진행할 수 있다. c. 문제 해결을 위해 프로토타이핑을 활용한다. d. 비지도 학습 방법을 활용해 패턴을 발견하고 통찰을 얻는다.
- 1.b, c
- 2.b, c, d
- 3.a, b, c
- 4.a, c, d
정답·해설 보기▾
정답
4번. a, c, d
해설
정답: 4. 상향식 접근은 데이터에서 출발해 인사이트를 얻고, 프로토타이핑과 비지도 학습으로 패턴을 탐색합니다. b는 폭포수식 특징이라 상향식의 핵심이 아닙니다.
오답 풀이
- 1번: b 포함되어 부적절합니다.
- 2번: b 포함되어 부적절합니다.
- 3번: b 포함되어 부적절합니다.
- 4번: a, c, d는 상향식 접근법의 특징입니다.
문제 20
4지선다데이터를 사용한 의사결정에 대한 주장으로 가장 적절한 것은?
- 1.전문가의 도메인 지식에 의한 의사결정을 우선하고 데이터는 보조 역할만 한다.
- 2.데이터에 근거해 판단하는 것은 근거 없는 대안보다 바람직하다.
- 3.시각화 같은 단순 표현 방식은 의사결정에 큰 도움이 되지 않는다.
- 4.주관과 직관은 유지하고 통계 분석은 참고용으로만 사용한다.
정답·해설 보기▾
정답
2번. 데이터에 근거해 판단하는 것은 근거 없는 대안보다 바람직하다.
해설
정답: 2. 데이터 기반 의사결정은 근거 없는 판단보다 합리성과 설명 가능성이 높습니다.
오답 풀이
- 1번: 도메인 지식은 중요하지만 데이터를 단순 보조에만 두는 것은 부적절합니다.
- 2번: 데이터 기반 판단은 근거를 강화합니다.
- 3번: 시각화는 의사결정에 중요한 도구입니다.
- 4번: 직관만 유지하고 통계를 참고용으로만 두는 것은 데이터 기반 의사결정 취지와 어긋납니다.
문제 21
4지선다다음 중 확률 관련 설명으로 잘못된 것은?
- 1.A와 B가 서로 배반사건이면 두 사건이 동시에 일어날 확률은 0이다.
- 2.실험을 통해 계산한 특정 사건의 상대도수는 시행 횟수가 많아질수록 실제 확률에 가까워진다.
- 3.조건부 확률을 기반으로 사전확률과 사후확률을 계산하는 것은 베이즈 정리와 관련된다.
- 4.A와 B가 서로 독립일 때 두 사건이 동시에 일어날 확률은 A의 확률과 B의 확률의 합이다.
정답·해설 보기▾
정답
4번. A와 B가 서로 독립일 때 두 사건이 동시에 일어날 확률은 A의 확률과 B의 확률의 합이다.
해설
정답: 4. 독립사건 A와 B가 동시에 일어날 확률은 P(A) × P(B)이지 P(A) + P(B)가 아닙니다.
오답 풀이
- 1번: 배반사건은 동시 발생 불가하므로 교집합 확률 0입니다.
- 2번: 상대도수는 시행 횟수가 많아지면 확률에 수렴합니다.
- 3번: 베이즈 정리는 조건부 확률로 사후확률을 계산합니다.
- 4번: 독립사건의 동시 발생은 곱셈법칙입니다.
문제 22
4지선다연관규칙 X → Y가 주어졌을 때, 향상도(Lift)를 구하시오.
거래 상품 1 X, Y, Z 2 X, Y, W 3 X, R 4 Y, Z 5 X, Y, Z, W 6 R - 1.9/8
- 2.8/9
- 3.7/8
- 4.8/7
정답·해설 보기▾
정답
1번. 9/8
해설
정답: 1. P(X)=4/6, P(Y)=4/6, P(X∩Y)=3/6. 신뢰도 P(Y|X)=3/4, P(Y)=2/3 이므로 Lift=(3/4)/(2/3)=9/8입니다.
오답 풀이
- 1번: 9/8 계산 결과 맞습니다.
- 2번: 8/9는 Lift 역수에 가까운 값입니다.
- 3번: 지지도·신뢰도 계산과 맞지 않습니다.
- 4번: 계산식과 맞지 않습니다.
문제 23
4지선다다음 중 요약변수에 대한 설명으로 틀린 것은?
- 1.분석에 유용한 정보를 요약해 보여준다.
- 2.여러 목적으로 재사용하기 쉽다.
- 3.특정 조건이나 함수에 의해 만들어져 의미가 부여된 파생변수이다.
- 4.데이터 마트에서 중요한 변수로 활용될 수 있다.
정답·해설 보기▾
정답
3번. 특정 조건이나 함수에 의해 만들어져 의미가 부여된 파생변수이다.
해설
정답: 3. 특정 조건이나 함수로 새 값을 만들어 의미를 부여한 변수는 요약변수보다 파생변수의 설명에 가깝습니다.
오답 풀이
- 1번: 요약변수는 원천 데이터를 분석 목적에 맞게 요약한 변수입니다.
- 2번: 여러 분석에서 반복 활용됩니다.
- 3번: 조건/함수로 생성한 변수는 파생변수 성격이 강합니다.
- 4번: 데이터 마트에서 분석 효율성을 높입니다.
문제 24
4지선다부트스트랩 표집에서 100개의 데이터 중 복원추출로 100번 추출할 때, 특정 1번 데이터가 한 번도 선택되지 않을 확률은?
- 1.100 - 1/100
- 2.100 × (1 - 1/100)
- 3.(1 - 1/100)^100
- 4.1 - (1/100)^100
정답·해설 보기▾
정답
3번. (1 - 1/100)^100
해설
정답: 3. 한 번 추출에서 1번 데이터가 선택되지 않을 확률은 1-1/100, 이를 100번 반복하므로 (1-1/100)^100입니다.
오답 풀이
- 1번: 확률식이 아닙니다.
- 2번: 기댓값에 가까운 형태입니다.
- 3번: 100번 연속 미선택의 확률입니다.
- 4번: 100번 모두 선택되는 사건의 여사건으로 다른 의미입니다.
보충 개념 n이 충분히 크면 (1-1/n)^n ≈ 1/e ≈ 0.368에 수렴합니다.
문제 25
4지선다다음은 Apriori 알고리즘의 수행 단계이다. 올바른 순서로 나열한 것은?
<보기> 가. 최소 지지도를 설정한다. 나. 반복적으로 수행하여 최소 지지도를 넘는 빈발품목집합을 찾는다. 다. 찾은 개별 품목을 이용해 2개 품목 집합을 찾는다. 라. 개별 품목 중 최소 지지도를 넘는 품목을 찾는다.
- 1.가 → 나 → 다 → 라
- 2.가 → 나 → 라 → 다
- 3.가 → 라 → 나 → 다
- 4.가 → 라 → 다 → 나
정답·해설 보기▾
정답
4번. 가 → 라 → 다 → 나
해설
정답: 4. 최소 지지도 설정 → 1개 품목 빈발항목 탐색 → 2개 품목 집합 생성 → 반복 수행 순서입니다.
오답 풀이
- 1번: 반복 수행이 개별 품목 탐색보다 앞서 부적절합니다.
- 2번: 반복 수행이 1개 품목 탐색보다 앞섭니다.
- 3번: 2개 집합 생성이 반복 뒤에 있어 부적절합니다.
- 4번: 가→라→다→나가 적절한 순서입니다.
문제 26
4지선다다음과 같은 로지스틱 회귀식이 만들어졌다. 해석으로 가장 적절한 것은?
<조건>
- P = Y 변수의 값이 1일 확률
- e^β1 = 1.006
- e^β2 = 0.489
특정 변수 X2가 1 증가할 때의 해석을 고르시오.
- 1.다른 변수들이 일정할 때 X2가 1 증가하면 Logit은 48.9% 감소한다.
- 2.다른 변수들이 일정할 때 X2가 1 증가하면 Logit은 48.9% 증가한다.
- 3.다른 변수들이 일정할 때 X2가 1 증가하면 Odds는 0.489배가 된다.
- 4.다른 변수들이 일정할 때 X2가 1 증가하면 Odds는 48.9% 증가한다.
정답·해설 보기▾
정답
3번. 다른 변수들이 일정할 때 X2가 1 증가하면 Odds는 0.489배가 된다.
해설
정답: 3. 로지스틱 회귀에서 exp(β)는 오즈비를 의미합니다. e^β2=0.489이므로 X2가 1 증가할 때 Odds는 0.489배가 됩니다 (약 51.1% 감소).
오답 풀이
- 1번: exp(β)는 Logit 변화율이 아니라 Odds 배율입니다.
- 2번: Logit 48.9% 증가 해석 부적절합니다.
- 3번: Odds가 0.489배 됨 — 정확한 해석입니다.
- 4번: 0.489 < 1 이므로 증가가 아니라 감소 방향입니다.
문제 27
4지선다다음 R 회귀분석 결과에 대한 해석으로 부적절한 것은?
<회귀분석 요약>
- 종속변수: Fertility
- 독립변수: Agriculture, Examination, Education, Catholic, Infant.Mortality 총 5개
- 잔차 자유도: 41
- Agriculture 회귀계수: 음수
- 일부 회귀계수의 p-value는 유의수준 0.05보다 큼
- Adjusted R-squared: 0.671
- 1.데이터의 개수는 자유도와 독립변수 개수를 이용해 46으로 볼 수 있다.
- 2.모든 회귀계수가 통계적으로 유의한 것은 아니다.
- 3.Agriculture가 증가하면 Fertility는 감소한다.
- 4.조정결정계수는 0.671이다.
정답·해설 보기▾
정답
1번. 데이터의 개수는 자유도와 독립변수 개수를 이용해 46으로 볼 수 있다.
해설
정답: 1. 잔차 자유도 = n - 추정 모수 개수. 독립변수 5 + 절편 1 = 6 추정 → n = 41+6 = 47. 데이터 개수를 46으로 보는 해석은 부적절합니다.
오답 풀이
- 1번: 절편까지 고려하면 데이터 개수는 47입니다.
- 2번: 일부 p-value가 유의수준보다 크므로 모든 회귀계수가 유의하지는 않습니다.
- 3번: 음수 계수는 Agriculture 증가 시 Fertility 감소를 의미합니다.
- 4번: Adjusted R-squared 0.671 그대로입니다.
문제 28
4지선다다음 중 비모수 검정에 대한 설명으로 잘못된 것은?
- 1.표본의 크기가 매우 작은 경우 비모수 검정을 고려할 수 있다.
- 2.모집단이 정규분포에 가까우면 비모수 검정이 모수 검정보다 항상 더 좋다.
- 3.평균이나 분산을 직접 계산하기 어려운 서열척도에는 비모수 검정이 적절할 수 있다.
- 4.특정 분포 가정 등 전제조건을 만족하기 어려운 경우 비모수 검정을 사용할 수 있다.
정답·해설 보기▾
정답
2번. 모집단이 정규분포에 가까우면 비모수 검정이 모수 검정보다 항상 더 좋다.
해설
정답: 2. 모집단이 정규분포에 가깝고 모수 검정 가정을 충족하면 일반적으로 모수 검정이 더 효율적입니다.
오답 풀이
- 1번: 표본 작거나 정규성 판단 어려울 때 비모수 검정을 고려합니다.
- 2번: 정규분포면 비모수가 항상 더 좋다는 설명은 틀립니다.
- 3번: 서열척도엔 순위 기반 비모수가 적절합니다.
- 4번: 분포 가정 어려울 때 비모수를 사용합니다.
문제 29
4지선다계층적 군집분석에서 군집의 개수를 결정하는 방법에 대한 설명으로 가장 적절한 것은?
- 1.와드 연결법을 사용할 때 오차제곱합이 크게 증가하는 지점을 참고할 수 있다.
- 2.단일 연결법은 군집 간 거리를 항상 최적으로 결정하는 데 가장 유리하다.
- 3.중심 연결법은 모든 상황에서 군집 간 거리 최적화에 가장 유리하다.
- 4.군집 수는 항상 2-3개 정도로 정하는 것이 가장 좋다.
정답·해설 보기▾
정답
1번. 와드 연결법을 사용할 때 오차제곱합이 크게 증가하는 지점을 참고할 수 있다.
해설
정답: 1. 계층적 군집분석에서 덴드로그램이나 군집 결합 시 거리·오차제곱합의 큰 변화 지점을 참고해 군집 수를 결정할 수 있습니다.
오답 풀이
- 1번: 와드 연결법은 군집 내 오차제곱합 증가 기준이라 큰 변화 지점이 참고됩니다.
- 2번: 단일 연결법은 chaining 문제로 항상 최적이 아닙니다.
- 3번: 중심 연결법도 모든 상황에서 최적이 아닙니다.
- 4번: 군집 수는 데이터 구조와 분석 목적에 따라 달라집니다.
문제 30
4지선다다음 품목/거래량 표를 사용하여 연관규칙 "우유 → 커피"의 신뢰도를 구하시오.
상품 거래회수 우유, 커피, 과자 10 우유, 과자 40 커피, 과자, 캔디 20 우유, 커피, 캔디 20 과자, 캔디 10 - 1.0.3
- 2.3/7
- 3.0.6
- 4.0.7
정답·해설 보기▾
정답
2번. 3/7
해설
정답: 2. 우유 포함 거래량 = 10+40+20 = 70. 우유∩커피 = 10+20 = 30. 신뢰도 = 30/70 = 3/7 ≈ 0.43.
오답 풀이
- 1번: 0.3은 다른 분모를 사용한 결과입니다.
- 2번: confidence(우유→커피) = support(우유∩커피)/support(우유) = 30/70 = 3/7입니다.
- 3번: 분모 계산이 다릅니다.
- 4번: 우유 포함 비율에 가까워 신뢰도가 아닙니다.
문제 31
4지선다다음 중 시계열 분석에 대한 설명으로 적절하지 않은 것은?
- 1.계절요인은 일정한 주기를 가지고 나타나는 규칙적 변동을 의미한다.
- 2.순환요인은 알려진 고정 주기로 반복되는 패턴이다.
- 3.불규칙요인은 추세, 계절, 순환 요인으로 설명되지 않는 나머지 변동이다.
- 4.추세요인은 일정 기간 동안 증가 또는 감소하는 장기적 경향을 의미한다.
정답·해설 보기▾
정답
2번. 순환요인은 알려진 고정 주기로 반복되는 패턴이다.
해설
정답: 2. 순환요인은 경기 변동처럼 주기가 일정하지 않거나 장기적으로 반복되는 변동이며, 고정 주기 반복은 계절요인에 가깝습니다.
오답 풀이
- 1번: 계절요인은 일정 주기 규칙적 변동입니다.
- 2번: 고정 주기 반복은 순환이 아니라 계절요인에 가깝습니다.
- 3번: 불규칙요인은 설명되지 않는 우연적 변동입니다.
- 4번: 추세요인은 장기 증가·감소 경향입니다.
문제 32
4지선다회귀분석에서 독립변수들 간에 강한 상관관계가 나타나는 문제를 가리키는 말은?
- 1.다중공선성
- 2.통계적 유의성
- 3.조정 결정계수
- 4.연관성
정답·해설 보기▾
정답
1번. 다중공선성
해설
정답: 1. 회귀분석에서 독립변수들끼리 강한 상관관계를 가지는 문제를 다중공선성이라고 합니다.
오답 풀이
- 1번: 다중공선성은 독립변수 간 높은 상관관계 문제입니다.
- 2번: 통계적 유의성은 추정 결과의 우연 여부 판단 개념입니다.
- 3번: 조정결정계수는 설명력 보정 지표입니다.
- 4번: 연관성은 회귀분석 특정 문제 명칭이 아닙니다.
보충 개념 다중공선성이 심하면 회귀계수 추정이 불안정해집니다. VIF로 확인할 수 있습니다.
문제 33
4지선다두 변수가 강한 양의 상관관계를 가질 때, 그 상관관계를 고려하여 거리를 계산하는 방법은?
- 1.맨하튼 거리
- 2.표준화 거리
- 3.유클리드 거리
- 4.마할라노비스 거리
정답·해설 보기▾
정답
4번. 마할라노비스 거리
해설
정답: 4. 마할라노비스 거리는 변수 간 공분산 구조를 고려하여 거리를 계산합니다.
오답 풀이
- 1번: 맨하튼 거리는 좌표 차이 절댓값 합으로 상관구조를 반영하지 않습니다.
- 2번: 표준화 거리는 척도 보정만 합니다.
- 3번: 유클리드 거리는 직선 거리로 상관관계 미고려입니다.
- 4번: 마할라노비스는 공분산 행렬을 활용해 상관을 반영합니다.
문제 34
4지선다다음 노드에서 두 클래스 A, B의 비율이 각각 0.4, 0.6일 때 지니 계수는?
- 1.0.44
- 2.0.46
- 3.0.48
- 4.0.50
정답·해설 보기▾
정답
3번. 0.48
해설
정답: 3. 지니 불순도 = 1 - Σp_i² = 1 - (0.4² + 0.6²) = 1 - (0.16 + 0.36) = 0.48입니다.
오답 풀이
- 1번: 0.44는 계산 결과와 다릅니다.
- 2번: 0.46도 계산 결과와 맞지 않습니다.
- 3번: 0.48이 정확한 값입니다.
- 4번: 0.50은 두 클래스 비율 0.5/0.5일 때 최대값입니다.
보충 개념 이진 분류에서 두 클래스 비율이 0.5/0.5일 때 지니 최대값 0.5가 됩니다.
문제 35
4지선다아래는 남학생과 여학생이 좋아하는 과일에 대한 빈도 교차표이다. 전체에서 1명을 뽑았을 때, 그 학생이 남학생이라는 조건하에 사과를 좋아할 확률은?
구분 딸기 사과 남 40 30 여 20 10 - 1.3/13
- 2.3/7
- 3.3/4
- 4.3/8
정답·해설 보기▾
정답
2번. 3/7
해설
정답: 2. 남학생 총 70명 중 사과를 좋아하는 남학생 30명 → P(사과|남) = 30/70 = 3/7입니다.
오답 풀이
- 1번: 3/13은 다른 분모를 사용한 값입니다.
- 2번: P(사과|남) = 남학생 중 사과 선호 / 전체 남학생 = 30/70 = 3/7입니다.
- 3번: 분모를 잘못 둔 값입니다.
- 4번: 조건을 잘못 적용한 값입니다.
문제 36
4지선다다음 중 시계열 데이터를 정상화하는 방법으로 적절하지 않은 것은?
- 1.정규화를 적용한다.
- 2.이상치를 제거한다.
- 3.차분 연산을 적용한다.
- 4.구간 분할을 수행한다.
정답·해설 보기▾
정답
4번. 구간 분할을 수행한다.
해설
정답: 4. 시계열 정상성 확보엔 차분·변환·이상치 처리 등을 사용하며, 구간 분할 자체는 정상화 방법으로 보기 어렵습니다.
오답 풀이
- 1번: 스케일 조정·변환은 전처리에 활용됩니다.
- 2번: 이상치 제거는 패턴 안정화에 도움됩니다.
- 3번: 차분은 추세 제거로 정상성 확보의 대표 방법입니다.
- 4번: 구간 분할은 정상화 대표 방법이 아닙니다.
문제 37
4지선다다음 중 주성분 분석(PCA)에 대한 설명으로 잘못된 것은?
- 1.서로 상관성이 있는 변수들을 상관성이 없는 주성분으로 변환한다.
- 2.차원 축소 목적으로 사용할 수 있다.
- 3.서로 직교하는 벡터 방향을 만들어 준다.
- 4.독립변수와 종속변수 사이의 선형관계를 파악하기 위한 분석이다.
정답·해설 보기▾
정답
4번. 독립변수와 종속변수 사이의 선형관계를 파악하기 위한 분석이다.
해설
정답: 4. 독립·종속변수의 선형관계 분석은 회귀분석에 가깝고, PCA는 변수들을 새 주성분으로 변환하는 차원 축소 기법입니다.
오답 풀이
- 1번: PCA는 상관 변수들을 직교 주성분으로 변환합니다.
- 2번: 대표적 차원 축소 기법입니다.
- 3번: 주성분은 서로 직교 방향입니다.
- 4번: 종속·독립변수 선형관계 분석은 회귀분석 설명입니다.
문제 38
4지선다K-means 군집분석에서 적절한 군집 수를 판단하는 데 활용할 수 있는 그래프는?
- 1.ROC 곡선
- 2.오차 제곱합
- 3.집단내 제곱합 그래프
- 4.향상도 곡선
정답·해설 보기▾
정답
3번. 집단내 제곱합 그래프
해설
정답: 3. K-means에서는 군집 수 k에 따른 집단내 제곱합(WSS) 변화를 보고 엘보우 포인트를 찾습니다.
오답 풀이
- 1번: ROC 곡선은 분류 모델 성능 평가입니다.
- 2번: 명칭만으로는 그래프로 부적절합니다.
- 3번: 집단내 제곱합 그래프는 엘보우 방법에 사용됩니다.
- 4번: 향상도 곡선은 분류·마케팅 모델 평가입니다.
보충 개념 엘보우 방법은 k 증가 시 WSS 감소폭이 급격히 줄어드는 지점을 적절한 군집 수로 봅니다.
문제 39
4지선다비복원 무작위추출 방법을 사용해 100개 자료에 1-100번 레이블을 부여하고, 10개 표본을 뽑았을 때 잘못된 설명은?
- 1.비복원 추출이므로 앞에서 특정 표본이 뽑히지 않았다면 뒤에서 뽑힐 조건부 확률은 달라질 수 있다.
- 2.1번과 2번이 동시에 표본에 포함될 확률은 1/100이다.
- 3.1번이 표본으로 뽑힐 확률과 100번이 표본으로 뽑힐 확률은 같다.
- 4.1번과 2번이 동시에 뽑힐 확률과 99번과 100번이 동시에 뽑힐 확률은 서로 같다.
정답·해설 보기▾
정답
2번. 1번과 2번이 동시에 표본에 포함될 확률은 1/100이다.
해설
정답: 2. 100개 중 10개 비복원 추출 시 특정 두 개가 모두 포함될 확률 = (10/100)×(9/99) = 1/110이지 1/100이 아닙니다.
오답 풀이
- 1번: 비복원 추출에서 이전 결과에 따라 조건부 확률이 달라집니다.
- 2번: 동시 포함 확률은 1/110이므로 틀렸습니다.
- 3번: 모든 번호는 대칭적이라 포함 확률이 같습니다.
- 4번: 두 번호 쌍이 동시 포함될 확률은 서로 같습니다.
문제 40
4지선다다음 중 군집분석에 관한 설명으로 옳지 않은 것은?
- 1.SOM을 적용하면 고차원 자료를 2차원 형태로 표현하여 군집 구조를 파악할 수 있다.
- 2.군집분석을 하려면 관측치 사이의 거리를 측정하기 위한 척도가 필요하다.
- 3.계층적 군집화 결과는 덴드로그램으로 시각화하여 해석할 수 있다.
- 4.국어, 수학, 영어, 과학, 사회 점수 기준으로 세 개 군집을 나누려면 반드시 k-means만 사용해야 한다.
정답·해설 보기▾
정답
4번. 국어, 수학, 영어, 과학, 사회 점수 기준으로 세 개 군집을 나누려면 반드시 k-means만 사용해야 한다.
해설
정답: 4. 세 개 군집 분할에 k-means를 사용할 수는 있지만 반드시 k-means만 사용해야 하는 것은 아닙니다.
오답 풀이
- 1번: SOM은 고차원을 저차원 격자로 표현해 구조 파악에 활용됩니다.
- 2번: 군집분석은 거리 척도를 기반으로 합니다.
- 3번: 계층적 군집은 덴드로그램으로 표현합니다.
- 4번: k-means 외에도 계층적·DBSCAN·SOM 등이 있습니다.
문제 41
4지선다스피어만 상관분석 방법으로 분석하기 가장 부적절한 척도는?
- 1.명목척도
- 2.서열척도
- 3.등간척도
- 4.비율척도
정답·해설 보기▾
정답
1번. 명목척도
해설
정답: 1. 스피어만 상관분석은 순위 정보를 활용하므로 서열척도 이상에 적합하며, 순서가 없는 명목척도에는 부적절합니다.
오답 풀이
- 1번: 명목척도는 순서가 없어 부적절합니다.
- 2번: 서열척도는 순위가 있어 적합합니다.
- 3번: 등간척도도 순위 변환으로 사용 가능합니다.
- 4번: 비율척도도 순위 변환으로 사용 가능합니다.
문제 42
4지선다모집단 개체에 1, 2, ..., N의 일련번호를 부여한 뒤 첫 번째 표본을 정하고 일정한 간격으로 표본을 선택하는 추출법은?
- 1.계통추출
- 2.단순임의추출
- 3.층화추출
- 4.집락추출
정답·해설 보기▾
정답
1번. 계통추출
해설
정답: 1. 번호를 부여한 뒤 일정 간격마다 표본을 선택하는 방법은 계통추출입니다.
오답 풀이
- 1번: 계통추출은 일정 간격 k로 표본을 뽑습니다.
- 2번: 단순임의추출은 무작위 선택입니다.
- 3번: 층화추출은 층으로 나누고 각 층에서 추출합니다.
- 4번: 집락추출은 집락을 나누고 일부 집락 선택입니다.
문제 43
4지선다다음 중 연관분석의 장점이 아닌 것은?
- 1.If~Then 형태로 표현되어 직관적으로 이해하기 쉽다.
- 2.명확한 목적변수를 정하지 않아도 분석할 수 있다.
- 3.비슷한 항목을 묶어 분석하면 계산량이 기하급수적으로 증가할 수 있다.
- 4.데이터를 큰 변환 없이 활용할 수 있어 비교적 간편하다.
정답·해설 보기▾
정답
3번. 비슷한 항목을 묶어 분석하면 계산량이 기하급수적으로 증가할 수 있다.
해설
정답: 3. 계산량이 기하급수적으로 증가하는 것은 연관분석의 장점이 아니라 단점입니다.
오답 풀이
- 1번: If~Then 형태로 해석이 쉽습니다.
- 2번: 목적변수 없이 항목 간 관계 탐색이 가능합니다.
- 3번: 항목 수 증가에 따른 계산량 폭증은 단점입니다.
- 4번: 거래 데이터를 비교적 직접 활용할 수 있습니다.
문제 44
4지선다다음 중 k-NN의 특징으로 틀린 것은?
- 1.별도의 명시적 학습 단계 없이 예측할 수 있다.
- 2.k가 클수록 과대적합이 될 수 있다.
- 3.가까운 k개의 이웃 값을 이용해 예측한다.
- 4.모수에 대한 강한 가정을 두지 않는 비모수 방법이다.
정답·해설 보기▾
정답
2번. k가 클수록 과대적합이 될 수 있다.
해설
정답: 2. k가 너무 작으면 과대적합 위험이 커지고, k가 너무 크면 과소적합 위험이 커집니다.
오답 풀이
- 1번: k-NN은 lazy learning 방식입니다.
- 2번: k가 클수록 과소적합에 가까워집니다.
- 3번: 가까운 k개 이웃의 평균이나 다수결로 예측합니다.
- 4번: 분포 가정 없는 비모수 방법입니다.
보충 개념 k-NN은 거리 기반이라 스케일링이 중요합니다.
문제 45
4지선다job이 0 또는 1일 때 다음 회귀식의 해석으로 부적절한 것은? 단, 모든 회귀계수는 통계적으로 유의하다고 한다.
- 1.두 집단 간 y절편은 다르다.
- 2.두 집단 간 age 회귀계수는 동일하다.
- 3.age가 증가할 때 wage의 증가량은 각 job 유형에서 동일하다.
- 4.age와 wage 사이의 교호작용이 유의하다.
정답·해설 보기▾
정답
4번. age와 wage 사이의 교호작용이 유의하다.
해설
정답: 4. 회귀식에 age×job 같은 교호작용항이 없으므로 age 효과가 job 유형에 따라 달라진다고 해석할 수 없습니다.
오답 풀이
- 1번: job=0이면 절편 5632, job=1이면 9353이므로 두 절편 다릅니다.
- 2번: age 계수는 job 무관 동일합니다.
- 3번: age 1 증가 시 wage 1300씩 증가가 두 집단에서 같습니다.
- 4번: 교호작용항 없으므로 교호작용 유의 해석 불가합니다.
보충 개념 더미변수만 포함된 회귀식은 집단별 절편 차이만 반영합니다.
문제 46
4지선다다음 중 상자그림에 대한 설명으로 틀린 것은?
- 1.Q1 이하의 값은 하위 25%에 해당한다.
- 2.중앙값보다 평균이 항상 더 크다.
- 3.사분위수의 위치를 쉽게 파악할 수 있다.
- 4.IQR을 쉽게 계산할 수 있다.
정답·해설 보기▾
정답
2번. 중앙값보다 평균이 항상 더 크다.
해설
정답: 2. 평균과 중앙값의 크기 관계는 분포 모양에 따라 달라지므로 평균이 항상 중앙값보다 크다고 할 수 없습니다.
오답 풀이
- 1번: Q1은 제1사분위수(하위 25%)입니다.
- 2번: 평균은 이상치·왜도에 영향을 받아 중앙값보다 항상 크지 않습니다.
- 3번: 상자그림은 Q1·중앙값·Q3 위치를 시각화합니다.
- 4번: IQR = Q3 - Q1로 계산 가능합니다.
문제 47
4지선다다음 중 비모수 검정으로 적절하지 않은 것은?
- 1.순위검정
- 2.Run 검정
- 3.Mann-Whitney U 검정
- 4.t 검정
정답·해설 보기▾
정답
4번. t 검정
해설
정답: 4. t 검정은 평균에 대한 모수 검정입니다.
오답 풀이
- 1번: 순위검정은 비모수 검정입니다.
- 2번: Run 검정은 무작위성 검정 비모수 방식입니다.
- 3번: Mann-Whitney U 검정은 두 독립표본 차이의 비모수 검정입니다.
- 4번: t 검정은 정규성 가정 모수 검정입니다.
문제 48
4지선다다음 중 중심극한정리에 대한 설명으로 부적절한 것은?
- 1.표본의 크기가 충분히 크면 표본평균의 분포는 정규분포에 가까워진다.
- 2.모집단의 확률분포가 비대칭이면 더 큰 표본 크기가 필요할 수 있다.
- 3.표본평균과 관련된 이론이다.
- 4.모집단이 반드시 정규분포를 따라야만 성립한다.
정답·해설 보기▾
정답
4번. 모집단이 반드시 정규분포를 따라야만 성립한다.
해설
정답: 4. 중심극한정리는 모집단이 정규분포가 아니어도 표본 크기가 충분히 크면 표본평균 분포가 정규분포에 가까워진다는 내용입니다.
오답 풀이
- 1번: 중심극한정리의 핵심입니다.
- 2번: 비대칭 모집단은 더 큰 표본이 필요할 수 있습니다.
- 3번: 표본평균 분포와 관련됩니다.
- 4번: 모집단 정규분포 가정 필요 없습니다.
문제 49
4지선다선형회귀분석에서 개별 회귀계수에 대한 t-검정의 귀무가설과 대립가설로 적절한 것은?
- 1.귀무가설: 회귀계수는 0이 아니다. 대립가설: 회귀계수는 0이다.
- 2.귀무가설: 회귀계수는 0이다. 대립가설: 회귀계수는 0이 아니다.
- 3.귀무가설: 회귀계수는 1이 아니다. 대립가설: 상관계수는 1이다.
- 4.귀무가설: 회귀계수는 1이다. 대립가설: 회귀계수는 1이 아니다.
정답·해설 보기▾
정답
2번. 귀무가설: 회귀계수는 0이다. 대립가설: 회귀계수는 0이 아니다.
해설
정답: 2. 선형회귀에서 개별 회귀계수의 t-검정은 보통 H0: β=0, H1: β≠0의 양측 검정 형태입니다.
오답 풀이
- 1번: 귀무가설과 대립가설이 반대로 제시됐습니다.
- 2번: 일반적인 양측 검정 형태입니다.
- 3번: 회귀계수와 상관계수를 혼동한 설명입니다.
- 4번: 회귀계수 유의성 검정 기준은 1이 아니라 0입니다.
문제 50
4지선다한 군집 내의 다른 데이터를 분석해도 동일하거나 유사한 결과가 나오는 특성은?
- 1.일반화
- 2.특정화
- 3.구간화
- 4.일관성
정답·해설 보기▾
정답
4번. 일관성
해설
정답: 4. 같은 군집 내 데이터가 유사한 분석 결과를 보이는 특성은 일관성과 가장 관련이 깊습니다.
오답 풀이
- 1번: 일반화는 학습 결과를 새 데이터에 적용하는 성질입니다.
- 2번: 특정화는 일반 개념을 특정 조건에 맞추는 의미입니다.
- 3번: 구간화는 연속형 데이터를 구간으로 나누는 처리입니다.
- 4번: 일관성은 동일·유사 조건에서 결과가 안정적인 특성입니다.