[Python-de] Zeichensatz einer Textdatei feststellen

Diez B. Roggisch deets at web.de
Fre Mar 18 12:19:33 CET 2005


Am Friday, 18. March 2005 11:56 schrieb Albert Hermeling:
> Guten Morgen,
>
> ich überlege gerade ob es möglich ist den verwendeten Zeichensatz einer
> Textdatei automatisch zu ermitteln.
> Der Hintergurnd meiner Überlegung ist, wenn ich Strings aus einer Datei mit
> mir unbekannten Zeichensatz lese und diesen String dann in Unicode
> umwandeln will, brauche ich den verwendeten Zeichensatz. Aber wie ermittele
> ich den? Gibt es dafür eine Python funktion oder muss ich auf externe
> Programme wie z. B. file unter Linux zurückgreifen?

Ein python-modul gibts AFAIK nicht.

File oder recode sind da die Kandidaten - die implementieren entsprechende 
Heuristiken.

Diez