[Python-de] xml mit Umlauten parsen

Mathias Uebel mathias.uebel at meeloon.de
Mo Mär 17 13:40:10 UTC 2008


Hallo Leute,

ich habe gerade keine Lösung für Folgendes:

# tv-movie lesen
import urllib2, re
my_url = urllib2.urlopen('http://www.tvmovie.de/rss/tvjetzt.xml')
my_xml = my_url.read()
my_url.close()

# tv-movie xml parsen
import xml.dom.minidom
dom = xml.dom.minidom.parseString(my_xml)

UnicodeEncodeError: 'ascii' codec can't encode character u'\xf6' in
position 28: ordinal not in range(128)

Beim lesen der Knoten (elem.getElementsByTagName()) etc. erhalte einen
Fehler, weil die geparste Datei Umlaute enthält. Wie kann ich das
verhindern?
Kann mich mal jemand anschubbsen? Wie macht man das?

Danke