문제
다음 중 데이터 사이언스에 대한 설명으로 적절하지 않은 것은?
① 수집된 데이터의 결측치 처리 및 이상치 제거를 통해 데이터 품질과 분석의 정확도를 높일 수 있다. ② 가용 데이터를 활용해 패턴을 학습하고, 이를 바탕으로 미래 데이터에 대한 예측 및 분류가 가능하다. ③ 데이터 사이언티스트의 소프트스킬로는 알고리즘 이해와 분석 능력이 포함된다. ④ 탐색적 데이터 분석을 통해 시각화와 기초 통계량을 활용하여 데이터의 분포와 변수 간의 잠재적 관계를 파악할 수 있다.
정답
3번
해설
정답: 3. 알고리즘 이해와 분석 능력은 이론적 지식·기술 숙련에 해당하는 하드스킬이다. 소프트스킬은 통찰력, 커뮤니케이션, 협력 능력 등을 말한다.
오답 풀이
- 1번: 결측·이상치 처리는 데이터 품질과 분석 정확도를 높인다.
- 2번: 패턴 학습 기반의 예측·분류는 데이터 사이언스의 핵심 기능이다.
- 3번: 하드스킬을 소프트스킬로 분류했으므로 옳지 않다.
- 4번: EDA를 통한 분포·관계 파악은 옳은 설명이다.
보충 개념 하드스킬: 빅데이터 이론적 지식, 분석 기술 숙련. 소프트스킬: 통찰력 있는 분석, 설득력 있는 전달, 다분야 협력.