[Python-de] Umlautproblem in Python 2.3

Georg Mischler schorsch at schorsch.com
Fri Feb 14 14:32:08 EST 2003


Detlef Lannert wrote:

> Naja, immerhin. Die Programmierer im fernen Osten haben
> wahrscheinlich ihre lokalen Schriftzeichen ohnehin nur in Unicode-
> Strings untergebracht (seit es letztere gibt).

Auch bei Unicode-Literals in einem nicht-Unicode Quelltext muss
der Zeichensatz bekannt sein, damit der Interpreter sie richtig
verarbeiten kann.  Kuerzlich wurde doch hier ein Unicode-FAQ
gepostet, welches das sehr anschaulich erklaert. Das meiste, was
ich zum Thema weiss, habe ich auch von dort...


> OK, jetzt verstehe ich das Problem. Aber dann würde es genügen, für
> Multibyte-Codierungen eine Code-Deklaration zu verlangen, die ja
> bisher nicht verwendbar waren.

Der Parser hat keine Moeglichkeit, von sich aus festzustellen,
ob ein 8-Bit Wert zu einem Single- oder einem Multibyte-Zeichen
gehoert. Er muss also entweder fuer allen 8-Bit Input eine
Deklaration vorschreiben, oder diesen komplett verbieten, wenn
Mehrdeutigkeiten zuverlaessig vermieden werden sollen.

Je schneller alle auf UTF-16 umstellen, desto besser... ;)


-schorsch

-- 
Georg Mischler  --  simulations developer  --  schorsch at schorsch com
+schorsch.com+  --  lighting design tools  --  http://www.schorsch.com/





More information about the Python-de mailing list