문제
다음 중 UTF-16 인코딩 방식에 대한 설명으로 가장 옳지 않은 것은?
① 기본 다국어 평면(BMP) 문자는 2바이트로 표현된다 ② 서로게이트 페어를 사용하여 BMP 외부 문자를 표현할 수 있다 ③ 바이트 순서 표시(BOM)를 통해 엔디안을 구분한다 ④ 모든 유니코드 문자를 동일하게 2바이트 고정 길이로 표현한다
정답
4번
해설
UTF-16은 가변 길이 인코딩 방식이다. BMP(U+0000U+FFFF) 문자는 2바이트로 표현되지만, BMP 외부 문자(U+10000U+10FFFF)는 서로게이트 페어를 사용하여 4바이트로 표현된다. 따라서 모든 문자가 2바이트 고정 길이라는 설명은 잘못되었다.