[Python-de] HTML parsen, ü nach ü

David Wojak Cherubyn at gmx.at
Don Dez 9 14:27:51 CET 2004


Hallo!

Ich möchte eine HTML Datei parsen, und alle maskierten Teile der Form
"ü" normal, also in dem Fall als "ü" darstellen, um die erhaltenen
Daten in weiterer Folge zu XML weiter zu verarbeiten.

Konkret: Man nehme HTML-Seite, parst sich gewisse Daten (bsp: Newspage wie
www.heise.de) und generiert daraus eine XML Datei.

Wie geh ich das an?

Bin noch relativ neu in Python, also bitte ned bös sein, wenn die Frage Müll
ist, allerdings hab ich hier ein Problem mit den Encodings... (ü ->
&#123)

Kann mir da wer helfen?

G,
David

-- 
NEU +++ DSL Komplett von GMX +++ http://www.gmx.net/de/go/dsl
GMX DSL-Netzanschluss + Tarif zum supergünstigen Komplett-Preis!