[Python-de] Isch habe verstanden

Martin v. Loewis martin at v.loewis.de
Thu Nov 7 21:51:04 EST 2002


Gerson.Kurz at t-online.de (Gerson Kurz) writes:

> # Zeichen sind jeweils zwei Byte lang (Little Endian)
> UNICODE_ENCODING = "utf-16le"

Richtig.

> # Zeichen sind normalerweise ein Byte lang, Sonderzeichen per
> "Escapesequenz" auf mehrere Bytes verteilt.
> UNICODE_ENCODING = "utf-8"

Richtig.

> # Zeichen sind jeweils ein Byte lang, Interpretation erfolgt
> abhängig von der Codepage. Wenn das Zeichen nicht in ein Byte
> (0..255) passt, gibt es eine Exception.
> UNICODE_ENCODING = "latin-1"

Falsch. Es gibt eine feste Zuordnung, welches Zeichen welchem Byte
entspricht, in latin-1. latin-1 *ist* eine Codepage (allerdings keine,
die von Windows so direkt unterstützt wird).

> Juhu! Oder?

Ich bin nicht begeistert: Ich habe gerade eine Stunde lang einen
Antwortartikel geschrieben.

Wie wäre es, wenn Du Dein frisch erworbenes Wissen in ein HOWTO
zusammenfasst? Niemand ausser Dir kann das, weil ich bis jetzt immer
noch nicht verstanden habe, was an Unicode so schwierig ist.

Ciao,
Martin





More information about the Python-de mailing list