[mailinglist] Re: [Python-de] htmllib und Umlaute

Klaus Meyer km-news1 at onlinehome.de
Thu May 1 16:59:28 EDT 2003


>> Wie verhalten sich die vielen in Python vorhanden Fkt/Module etc., die
>> irgendwo Strings erwarten?
>
> Die verhalten sich alle richtig...

Hm, Im Prinzip ja, denn da es ja zB für Tkinter, obwohl schon lange in 
Python vorhanden, in der Py-Doku immer noch keine richtige Beschreibung 
gibt, ist natürlich jedes Verhalten "richtig" ;-)

Bei der Rückgabe von Strings aus Entry und Filedialoge habe ich folgendes 
festgestellt:

Es sind Bytestrings, solange die Filenamen oder Tex im Entry ohne Umlaute 
sind, sonst sind es Unicode-Strings.
Vermutlich ist das Verhalten so "richtig"?

Beim umgekehrten Weg, Ausgabe mit insert() in Widgets wie Entry oder Text, 
habe bisher noch keine Unicode-Errors gesehen, obwohl doch zB Print schnell 
einen Unicode-Error wirft. Hm, das Verhalten von Tkinter bleibt hier etwas 
unklar. Es scheint mir ein Latin-1-Default zu geben für Bytestrings mit 
darin enthaltenen Zeichen > 127.



Zur Erzeugung von Unicode-Strings gibt es zB die folgenden 2 Methoden:

unicode("String", "encode")
u"String"

Im ersten Fall kann man einen Encoder angeben, aber nach welchem System 
wird eigentlich bei u"" encodet? Hier muss doch ein Default wirken?

>>> unicode("Götter", "latin-1")
u'G\x94tter'
>>> unicode("Götter", "cp850")
u'G\xf6tter'
>>> a=u"Götter"
>>> a
u'G\x94tter'


-- 
Mit freundlichen Grüßen
Klaus Meyer :-)




More information about the Python-de mailing list