[Python-de] HTML mit RegEx filtern

Stefan Antonelli stefan.antonelli at operun.de
Mi Dez 20 14:21:50 CET 2006


Hallo,

ich würde gerne in Python einen String manipulieren. HTML-Code soll dabei
bereinigt bzw. umgewandelt werden:

aus <img src='url' alt='irgendwas'> soll <img src='url'> werden. Das lässt sich
prinzipiell mit dem RegEx Modul machen? Dazu fehlt mir noch die passende
Expression...

Hier komm ich gerade nicht weiter:

string = re.sub(r"\&(.*?);", mat.group(0), text)

Danke schon mal für Hilfe.

Stefan.