문제
다음 중 한글 완성형 코드(KS C 5601)의 한계를 극복하기 위해 개발된 가변 길이 인코딩 방식으로, ASCII 코드와의 하위 호환성을 유지하면서도 전 세계 모든 문자를 표현할 수 있는 방식은?
① UTF-16 - 16비트 고정 길이로 문자를 표현하는 방식 ② UTF-32 - 32비트 고정 길이로 문자를 표현하는 방식 ③ UTF-8 - 1~4바이트 가변 길이로 문자를 표현하는 방식 ④ UCS-2 - 2바이트 고정 길이로 문자를 표현하는 방식
정답
3번
해설
UTF-8은 유니코드를 인코딩하는 가변 길이 방식으로, ASCII 문자는 1바이트로 그대로 표현하여 ASCII와의 하위 호환성을 유지하고, 한글 등은 여러 바이트로 표현한다. ①번 UTF-16은 기본적으로 2바이트 단위를 사용하지만 서로게이트 페어를 통해 4바이트도 사용할 수 있어 ASCII와 직접 하위 호환되지 않는다. ②번 UTF-32는 4바이트 고정 길이 방식이고, ④번 UCS-2는 초기 유니코드 표현 방식으로 현재는 제한적으로만 사용된다. UTF-8의 가변 길이 특성과 ASCII 호환성이 웹 표준으로 널리 채택된 핵심 이유이다.