ANSI, UNICODE, Charset

■ANSI
  ▣KS C 5601 (완성형, 한글 2350자 지원, 현재이름은 KS X 1001)
    Windows Codepage: CP949
    Linux Character Set: EUC-KR

■Unicode
  ▣관리: 유니코드 컨소시엄(Unicode Consortium)
  ▣버전: 2022년 9월 14일에 발표된 15.0
  ▣표준: ISO/IEC 10646 Universal Character Set
  ▣표기법: 한글"가"(AC00) > U+AC00
  ▣한글: 11,172자가 U+AC00~D7A3 에 재배치

  ▣UCS-2 (Universal Character Set 2 octets)
    고정길이(2바이트)
    UCS-2 (Big Endian)
    UCS-2 (Little Endian)

  ▣UTF-16 (UCS Transformation Format, 16bit form)
    UCS-2에서 Supplementary Characters(😒👌🤷‍♂️💋 ...) 지원

  ▣UTF-8 (UCS Transformation Format, 8bit form)
    ASCII Code와 호환
    가변길이(1~4바이트)
    한글: 3바이트
    Supplementary Characters(😒👌🤷‍♂️💋 ...): 4바이트
    Windows Codepage: CP65001
    Linux Character Set: UTF-8

  ▣한글 "가"를 저장했을 경우 코드
    UCS-2 Big Endian: FE FF AC 00
    UCS-2 Little Endian: FF FE 00 AC
    UTF-8: EA B0 80
    UTF-8 BOM: EF BB BF EA B0 80
    ANSI: B0 A1
    ※BOM: Byte Order Mark (UTF-16: U+FEFF, UTF-8: U+EFBBBF)
위로 스크롤