[Python-de] UTF-8 Python Datei

Stefan Schwarzer sschwarzer at sschwarzer.net
Mon Apr 25 21:24:45 CEST 2005


Hallo Albert,

On 2005-04-25 20:53, Albert Hermeling wrote:
> Das Skript ist! unicode warum ist dann type("Äpfel") im unicode Skript nicht
> von type unicode?

zwei Dinge sind zu unterscheiden:

- Die Zeile

  #-*- coding: UTF-8 -*-

  sagt dem Python-Interpreter, dass die _Programmdatei_ in UTF-8 kodiert
  ist. Das muss der Interpreter wissen, damit er beim Einlesen der Datei
  nicht stolpert, d. h. erkennen kann, wo die Bytes für jeweils ein
  Zeichen beginnen und enden.

- Davon unabhängig legst du mit "string" bzw. u"unicode string" den
  Typ der _Stringkonstanten_ fest, die du in der Datei verwendest.

Du kannst auch beides unabhängig voneinander festlegen, z. B. kann die
Datei in ISO-8859-1 kodiert sein, aber nichtsdestotrotz Unicode-Strings
enthalten.

Viele Grüße
Stefan