[Python-de] Re: XML, Umlaute, Unicode, Projektorganisation, RPC, MPUC - Wer bietet mehr?

Martin v. Löwis martin at v.loewis.de
Mit Jul 23 20:53:31 EDT 2003


Thomas Heller <theller at python.net> writes:

> Ich hab das anscheinend doch noch nicht verstanden.
> 
> 1. Woher weiß Python welche Kodierung die Console benutzt?

GetConsoleCP/GetConsoleOutputCP unter Windows, nl_langinfo(CODESET)
unter Unix.

> 2. Ich habe PEP 263 so verstanden, daß es nur um Unicode Literale im
> Quelltext geht, die dann wohl bei der Kompilierung in unicode Objekte
> umgewandelt werden.  Daher ist dann auch das Encoding aus dem comment
> später nicht mehr zugänglich (weil es auch garnicht mehr gebraucht
> wird).

Korrekt.

> 3. Ich habe in dem Beispiel oben latin-1 hingeschrieben, weil ich PEP
> 263 so verstanden habe daß das in Python 2.1 und 2.2 der Default ist,
> und ich dachte daß das Ganze dann portabel zwischen 2.2 und 2.3 ist.

Ach so. Wenn Du tatsächlich lediglich Latin-1-Zeichen brauchst, dann
ist es wirklich portabel (über Versionen hinweg), Latin-1 als
Quellkodierung zu verwenden.

> Es geht mir um eine Python Quelldatei die als Konfigurationsscript
> dient. Möglicherweise tippen dann doch koreanische Benutzer (keine
> Programmierer) darin herum, daher lieber explizite Zeichen als
> Escapesequenzen. Mit utf-8 Kodierung und notfalls Notepad als Editor
> sollte das dann also (in 2.3) gehen?

Genau. Wenn die Datei initial ein BOM hat, versteht entweder der
Editor, was gemeint ist, oder er zeigt gleich am Anfang "funny
characters", und die Nutzer nehmen vielleicht davon Abstand, in der
Datei herumzutippen.

Ciao,
Martin