- Verwendet MIME
- Ausgelieferte Text-Dokumente (plain oder HTML) haben charset.
- HTML kennt "Entities" für weitere Zeichen:
→ →
→ →
→ →
-
URLs sind ASCII.
-
Octets >= 0x80 können mit %XX kodiert werden
-
haben aber keine definierte Semantik!
- GET Requests (häufig bei Abfragen): Parameter im URL
(daher kein Content-Type und somit kein charset)
- POST Requests: URL-Encoding im Body (auch kein charset)
- POST Requests: Content-Type multipart/form-data:
Theoretisch charset möglich, Browser senden es aber nicht.
-
Server kann nur raten, welches Charset der Browser
verwendet.
-
Alle(?) Browser schicken immer charset der Seite, auf der
die Form war (Puh!)
|