■ANSI
▣KS C 5601 (완성형, 한글 2350자 지원, 현재이름은 KS X 1001)
Windows Codepage: CP949
Linux Character Set: EUC-KR
■Unicode
▣관리: 유니코드 컨소시엄(Unicode Consortium)
▣버전: 2022년 9월 14일에 발표된 15.0
▣표준: ISO/IEC 10646 Universal Character Set
▣표기법: 한글"가"(AC00) > U+AC00
▣한글: 11,172자가 U+AC00~D7A3 에 재배치
▣UCS-2 (Universal Character Set 2 octets)
고정길이(2바이트)
UCS-2 (Big Endian)
UCS-2 (Little Endian)
▣UTF-16 (UCS Transformation Format, 16bit form)
UCS-2에서 Supplementary Characters(😒👌🤷♂️💋 ...) 지원
▣UTF-8 (UCS Transformation Format, 8bit form)
ASCII Code와 호환
가변길이(1~4바이트)
한글: 3바이트
Supplementary Characters(😒👌🤷♂️💋 ...): 4바이트
Windows Codepage: CP65001
Linux Character Set: UTF-8
▣한글 "가"를 저장했을 경우 코드
UCS-2 Big Endian: FE FF AC 00
UCS-2 Little Endian: FF FE 00 AC
UTF-8: EA B0 80
UTF-8 BOM: EF BB BF EA B0 80
ANSI: B0 A1
※BOM: Byte Order Mark (UTF-16: U+FEFF, UTF-8: U+EFBBBF)