[Python-de] HTML mit RegEx filtern

Diez B. Roggisch deets at web.de
Mi Dez 20 15:25:36 CET 2006


On Wednesday 20 December 2006 14:21, Stefan Antonelli wrote:
> Hallo,
>
> ich würde gerne in Python einen String manipulieren. HTML-Code soll dabei
> bereinigt bzw. umgewandelt werden:
>
> aus <img src='url' alt='irgendwas'> soll <img src='url'> werden. Das lässt
> sich prinzipiell mit dem RegEx Modul machen? 

Prinzipiell ja, aber es ist eine schlechte idee. Nimm stattdessen 
BeautifulSoup. 

Das Problem mit regulaeren Ausdruecken und HTML ist einfach, das sie immer 
komplizierter werden und immer mehr Spezialfaelle anhaeufen. 

Use the right tool for the job.

Die