[mailinglist] Re: [Python-de] htmllib und Umlaute

Klaus Meyer km-news1 at onlinehome.de
Sun Apr 27 13:37:03 EDT 2003


Hallo Martin,

> Das liegt daran, dass man in IDLE keine Umlaute eingeben kann.

Hm, wenn ich da ein Umlaut eingebe, dann nimmt er das aber ohne Probleme an 
und zeigt es mir am Bildschirm in IDLE an. Ich vermute mal, kodiert nach 
Latin-1, weil das der Win-Standard ist?

> Falsch. Python-Byte-Strings enthalten Bytes im Bereich 0..255.
Puh, dann bin ich ja erstmal beruhigt ;-)
Also so?
a = "abc"	#Das wäre dann 8 Bit. Bis 7 Bit ASCII kodiert, alles darüber muss
		#durch eine Codepage interpretiert werden

a = u"abc"	#intern 16 (oder 32?) Bit/Zeichen, vermutlich UTF-16?

> Zeichen diese Bytes bedeuten hängt von der verwendeten Kodierung ab
> (Latin-1, CP437, ASCII, UTF-8).

Was bedeutet aber "verwendete Kodierung". So wie es aussieht, verwendet 
Python per Default  ASCII? Kann ich die "verwendete Kodierung" global für 
ein Script umschalten, oder muss man das für jeden String (sobald mehr als 
ASCII) explizit mit encode() machen?
Gibt es einen Py-Befehl, um mir die default-Kodierung ausgeben zu lassen?

> o-umlaut (Latin-1=CP1252, CP437, CP850, UTF-8, MacRoman, ...)
OK. Gibt es Empfehlungen, welche CP man für Win-Programme und welche für 
Linux-Programme verwenden kann? Meines Wissen verwendet Win Latin-1.

> Klar. Du musst Dich bloss entscheiden, welche Kodierung Du verwenden
> willst.
OK, ich will Latin-1, wie stelle ich das für meinen Script global ein? ;-)


Danke für Deine Antwort und für die Links, werde ich mir bestimmt noch 
anschauen!

-- 
Mit freundlichen Grüßen
Klaus Meyer :-)




More information about the Python-de mailing list