문제
다음 설명에 해당하는 빅데이터 관련 기술로 알맞은 것은?
대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다.
① Hadoop ② NoSQL ③ R ④ Anisible
정답
1번
해설
정답: 1. Hadoop(하둡)은 대규모 클러스터에서 분산 저장(HDFS)·분산 처리(MapReduce)를 지원하는 자바 기반 오픈소스(프리웨어) 프레임워크이다.
오답 풀이
- 1번: 대용량 분산 처리용 자바 프레임워크 Hadoop 으로 옳다.
- 2번: NoSQL 은 관계형이 아닌 데이터베이스 분류(개념)이지 분산 처리 프레임워크 자체가 아니다.
- 3번: R 은 통계 분석·시각화에 특화된 프로그래밍 언어이다.
- 4번: "Anisible" 은 Ansible(구성 관리·자동화 도구)의 오타로, 빅데이터 분산 처리 프레임워크가 아니다.
보충 개념 Hadoop = HDFS(분산 파일시스템) + MapReduce(분산 처리) + YARN(자원 관리). 자바 기반의 대표적 빅데이터 프레임워크다.