[Python-de] Re: XML, Umlaute, Unicode, Projektorganisation, RPC, MPUC - Wer bietet mehr?

Detlef Lannert lannert at uni-duesseldorf.de
Don Jul 24 12:52:49 EDT 2003


Martin v. Löwis <martin at v.loewis.de> wrote:
> > 3. Ich habe in dem Beispiel oben latin-1 hingeschrieben, weil ich PEP
> > 263 so verstanden habe daß das in Python 2.1 und 2.2 der Default ist,
> > und ich dachte daß das Ganze dann portabel zwischen 2.2 und 2.3 ist.
> 
> Ach so. Wenn Du tatsächlich lediglich Latin-1-Zeichen brauchst, dann
> ist es wirklich portabel (über Versionen hinweg), Latin-1 als
> Quellkodierung zu verwenden.

Wenn ich mich recht entsinne, war für Python 2.3 versprochen worden, daß
die PendingDeprecationWarning (z.B. bei Umlauten in Kommentaren) global
abgestellt werden kann oder auch für ein System die Source Encoding z.B.
auf Latin-1 voreingestellt werden kann (mit den bekannten Risiken, wenn
man die Sources dann z.B. nach Südostasien verschickt).

Wie geht das denn nun?

> > Es geht mir um eine Python Quelldatei die als Konfigurationsscript
> > dient. Möglicherweise tippen dann doch koreanische Benutzer (keine
> > Programmierer) darin herum, daher lieber explizite Zeichen als
> > Escapesequenzen. Mit utf-8 Kodierung und notfalls Notepad als Editor
> > sollte das dann also (in 2.3) gehen?
> 
> Genau. Wenn die Datei initial ein BOM hat, versteht entweder der
> Editor, was gemeint ist, oder er zeigt gleich am Anfang "funny
> characters", und die Nutzer nehmen vielleicht davon Abstand, in der
> Datei herumzutippen.

Dafür ist die Datei dann unter Linux nicht mehr als ausführbares
Programm zu gebrauchen (das #! wird nicht erkannt). Unter Windows mag
das gehen, für Linux ist auf absehbare Zeit dringend davon abzuraten.

  Detlef