[Python-de] xml mit Umlauten parsen

Diez B. Roggisch deets at web.de
Mo Mär 17 15:20:27 UTC 2008


On Monday 17 March 2008 14:40:10 Mathias Uebel wrote:
> Hallo Leute,
>
> ich habe gerade keine Lösung für Folgendes:
>
> # tv-movie lesen
> import urllib2, re
> my_url = urllib2.urlopen('http://www.tvmovie.de/rss/tvjetzt.xml')
> my_xml = my_url.read()
> my_url.close()
>
> # tv-movie xml parsen
> import xml.dom.minidom
> dom = xml.dom.minidom.parseString(my_xml)
>
> UnicodeEncodeError: 'ascii' codec can't encode character u'\xf6' in
> position 28: ordinal not in range(128)
>
> Beim lesen der Knoten (elem.getElementsByTagName()) etc. erhalte einen
> Fehler, weil die geparste Datei Umlaute enthält. Wie kann ich das
> verhindern?
> Kann mich mal jemand anschubbsen? Wie macht man das?

Funktioniert bei mir wie oben beschrieben - voellig ohne probleme.

wo genau bitte kommt denn der Fehler? beim erzeugen des DOM? Oder in code den 
du uns nicht zeigst?

Diez