<< >>

Unicode Transformation Formats

UCS-2 / UCS-4

  • 2 Byte bzw. 4 Byte pro Zeichen
  • Little oder Big Endian durch Byte Order Mark unterschieden

UTF-7

  • 0000-007F (großteils) unverändert
  • Rest ist UCS-2BE (eigentlich UTF-16) base-64-kodiert.
  • Umschalten durch + und -

UTF-8

  • 0000-007F unverändert
  • 0080-07FF 2 Bytes
  • 0800-FFFF 3 Bytes
  • ...

, 2020-2-28