AW: AW: [Python-de] Zeichensatz einer Textdatei feststellen

Rainer Fischbach fischbach at ecs-gmbh.de
Fre Mar 18 14:23:47 CET 2005



-----Ursprüngliche Nachricht-----
Von: Andreas Jung [mailto:lists at andreas-jung.com] 
Gesendet: Freitag, 18. März 2005 12:51
An: Rainer Fischbach; Albert Hermeling; python-de at python.net
Betreff: Re: AW: [Python-de] Zeichensatz einer Textdatei feststellen



--On Freitag, 18. März 2005 12:28 Uhr +0100 Rainer Fischbach 
<fischbach at ecs-gmbh.de> wrote:
>
> Man muss einfach wissen, welcher Zeichensatz verwendet wird.
> Insbesondere, wenn die die 8-Bit-Zeichen aus den diversen
> iso-8859-x-Zeichensätzen sicher transportieren möchtest, ist es
> empfehlenswert, die Dateien in Unicode zu konvertieren.

"Die Dateien in Unicode zu konvertieren"? Dateien sind auf normalen 
Filesystem
ein Stream von Bytes. Unicode ist etwas abstraktes, dass erst durch ein 
entsprechendes
Encoding in einen Byte-Stream überführt werden kann. Insofern macht Deine 
Bemerkung
keinen Sinn. Anders sieht es glaube ich bei Windows Dateisystemen aus, die 
per Default immer alles
in einem bestimmten Unicode ENcoding (UTF16?) schreiben.

Dass damit der (Text-)Inhalt dieser Dateien und nicht ihre physikalische Repräsentation gemeint ist, erschließt sich glaube ich jedem, der es verstehen will.

sl, Rainer