[Python-de] mit RegEx text extrahieren?

Walter Dörwald walter at livinglogic.de
Fre Jul 4 20:15:48 EDT 2003


Guenther Sommermann wrote:

> Ok, wenn das nicht so einfach geht, poste ich mal "ganz" genaue infos:
> 
> Im Grunde will ich mir ein Skript schreiben, das Titel und URL der
> aktuellen Heise-News auf eine Website (soll nur lokal laufen)
> schreibt. (Im moment hol ich mir erstmal nur die URL.)
> 
> (Vorweg: Das ganze könnte man wahrscheinlich am besten mit einem
> XML-Parser machen (hab ich mir auch shcon angeschaut), aber da ich
> grade erst anfange Python zu lernen is mir das noch zu hoch.....)

Das ganze mit einem XML-Parser zu machen, wäre wohl die sauberste
Lösung.

Hier mein Vorschlag: http://styx.livinglogic.de/~walter/heise.py

Das ganze benötigt XIST, was Du unter
http://www.livinglogic.de/Python/xist/ finden kannst.

Das Skript parst das XML-Dokument in einen speziellen DOM, der
seine Konversionsmethoden zur Konvertierung nach HTML gleich
mitbringt.

Ich hoffe, das hilft Dir weiter.

Bis demnächst,
    Walter Dörwald

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde geschreddert...
Dateiname   : heise.py
Dateityp    : text/x-python
Dateigröße  : 1257 bytes
Beschreibung: nicht verfügbar
URL         : http://starship.python.net/pipermail/python-de/attachments/20030704/ca35f1b3/heise-0001.py