[Python-de] mit RegEx text extrahieren?

Guenther Sommermann GueSo at gmx.ch
Fre Jul 4 17:02:15 EDT 2003


Hi Liste

Ich habe hier eine Textdatei mit folgendem Format:

<htmltag>URL-einer-Seite</htmltag>
<htmltag>URL-einer-anderen-Seite</htmltag>
<htmltag>URL-von-nocheiner-Seite</htmltag>

Aus dieser Datei würde ich jetzt gern nur den Text zwischen den
Html-Tags extrahieren...

Ich habe versucht die Datei mit "readlines()" einzulesen, das geht
auch soweit ganz gut.
Allerdings scheitere ich jetzt an dem RegEx..

Mit welchem RegEx kann ich NUR den Text extrahieren bzw. ausschließen
das die Html-Tags mit extrahiert werden?
(Soviel wie: gib mir alles was zwischen dem und dem Html-Tag steht)


Gruß Günther
(Python Newbie)

-----
 /"\            mailto: GueSo at gmx.ch
 \ /
  X ASCII RIBBON CAMPAIGN - AGAINST HTML MAIL
 / \