[Python-de] re und findall

Albert Hermeling Albert.Hermeling at t-online.de
Mon Feb 28 00:30:12 CET 2005


Guten Abend,

ich habe folgenden Regulären Ausdruck erstellt der mir alle Meta-Angaben aus 
einer HTML Datei extrahiert:

a = re.compile(r"<.*[meta].+>",flags=re.I | re.U | re.S)

Der Reguläre Ausdruck funktioniert in soweit das alle Meta-Angaben gefunden 
werden.

Benutze ich jetzt a.findall(string) werden alle Meta Vorkommen zusammen in 
einem Index gespeichert

Beispiel:

meta = "<META http-equiv="Content-Type" content="text/html; 
charset=iso-8859-15"><meta name="robots" content="index, follow">"

a.findall(meta)

!!Ausgabe:!!
['<META http-equiv="Content-Type" content="text/html; 
charset=iso-8859-15"><meta name="robots" content="index, follow">']

Nach meinem Verständnis müßten es zwei Einträge in der Liste sein. Wo ist hier 
mein Denkfehler?

Ich sage schon mal Danke im Voraus

mfg

Albert