문제
다음 중 데이터 형태에 대한 설명으로 적절하지 않은 것은?
① 정형 데이터는 행/열로 구성된 스프레드시트 형태로 나타낼 수 있다. ② IoT 기기에서 생성되는 로그 데이터는 대표적인 정형 데이터이다. ③ 반정형 데이터는 데이터 구조에 대한 메타 정보를 데이터 내부에 포함한다. ④ 대표적인 반정형 데이터로는 HTML, XML, JSON 등 웹 기반 데이터가 있다.
정답
2번
해설
정답: 2. 기계·센서가 생성하는 로그 데이터는 대표적인 반정형 데이터이며, 정형 데이터로 분류하는 것은 옳지 않다.
오답 풀이
- 1번: 정형 데이터는 고정된 스키마(행/열)를 가지며 스프레드시트·RDB 테이블로 표현된다.
- 2번: 로그는 스키마가 데이터에 포함된 반정형 데이터이므로 옳지 않다.
- 3번: 반정형 데이터는 태그 등 메타 정보를 데이터 안에 포함한다.
- 4번: HTML·XML·JSON은 대표적인 반정형 데이터이다.
보충 개념 정형(RDB·스프레드시트) / 반정형(XML·JSON·HTML·로그·센서 데이터) / 비정형(텍스트·이미지·영상·음성)으로 구분한다.