AW: [Python-de] Zeichensatz einer Textdatei feststellen

Andreas Jung lists at andreas-jung.com
Fre Mar 18 12:50:32 CET 2005



--On Freitag, 18. März 2005 12:28 Uhr +0100 Rainer Fischbach 
<fischbach at ecs-gmbh.de> wrote:
>
> Man muss einfach wissen, welcher Zeichensatz verwendet wird.
> Insbesondere, wenn die die 8-Bit-Zeichen aus den diversen
> iso-8859-x-Zeichensätzen sicher transportieren möchtest, ist es
> empfehlenswert, die Dateien in Unicode zu konvertieren.

"Die Dateien in Unicode zu konvertieren"? Dateien sind auf normalen 
Filesystem
ein Stream von Bytes. Unicode ist etwas abstraktes, dass erst durch ein 
entsprechendes
Encoding in einen Byte-Stream überführt werden kann. Insofern macht Deine 
Bemerkung
keinen Sinn. Anders sieht es glaube ich bei Windows Dateisystemen aus, die 
per Default immer alles
in einem bestimmten Unicode ENcoding (UTF16?) schreiben.

-aj
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : nicht verfügbar
Dateityp    : application/pgp-signature
Dateigröße  : 186 bytes
Beschreibung: nicht verfügbar
URL         : http://starship.python.net/pipermail/python-de/attachments/20050318/b89d983b/attachment.pgp