<< >>

World Wide Web (or Woe?)

  • Verwendet MIME
  • Ausgelieferte Text-Dokumente (plain oder HTML) haben charset.
  • HTML kennt "Entities" für weitere Zeichen: &rarr; &#x2192; &#8594;
  • URLs sind ASCII.
  • Octets >= 0x80 können mit %XX kodiert werden
  • haben aber keine definierte Semantik!

Forms

  • GET Requests (häufig bei Abfragen): Parameter im URL (daher kein Content-Type und somit kein charset)
  • POST Requests: URL-Encoding im Body (auch kein charset)
  • POST Requests: Content-Type multipart/form-data: Theoretisch charset möglich, Browser senden es aber nicht.
  • Server kann nur raten, welches Charset der Browser verwendet.
  • Alle(?) Browser schicken immer charset der Seite, auf der die Form war (Puh!)

, 2020-2-28