[Python-de] UTF-8 Python Datei

Simon Pamies bipbap at gmx.de
Die Apr 26 10:29:58 CEST 2005


Am 26.04.2005 um 00:27 schrieb Martin v. Löwis:

> Simon Pamies wrote:
>> Das Skript (der Code) ist Unicode
>
> Das ist der Trugschluss. Das Script ist *nicht* Unicode.
>
> Es ist in UTF-8 gespeichert, und Unicode und UTF-8 sind überhaupt
> nicht dasgleiche. UTF-8 ist eine Zeichenkodierung, so wie us-ascii,
> ISO-8859-1 und windows-1252.
>
> Unicode ist ein Zeichen*satz* (keine Byte-Kodierung), und, in
> Bezug auf Python, ein Datentyp (so wie int, list, dict).

Ups - aber ich hab das Richtige gemeint :-) Und wieder was dazu gelernt!

> Die konkreten Byte-Strings sind UTF-8-kodiert.

Das würde ja bedeuten dass

 >>> g = u"Täst".encode('utf8')
 >>> j = 'Täst'
 >>> g==j

eigentlich True ergeben müsste (wegen gerade Python-losen Computer 
ungetestet). Oder lieg ich da falsch oder hab dich falsch verstanden?

Gruß
Simon