[Python-de] re und findall

Diez B. Roggisch deets at web.de
Mon Feb 28 11:22:26 CET 2005


> Nach meinem Verständnis müßten es zwei Einträge in der Liste sein. Wo ist
> hier mein Denkfehler?

Auch wenn man das ganze damit hinbekommen kann: der Denkfehler ist, regulaere 
Ausdruecke zu benutzen. Das hier ist alles, was man braucht:

---------------------
import sgmllib

class MetaExtractor(sgmllib.SGMLParser):

    def start_meta(self, attributes):
        print attributes

page = """
<html><header><META http-equiv="Content-Type" content="text/html; 
charset=iso-8859-15"><meta name="robots" content="index, follow"></header>
<body></body></html>
"""

me = MetaExtractor()
me.feed(page)
me.close()
--------------------

Und dein "da laeuft soooviel code"-Argument ist nicht schluessig: Mit dem 
Argument verzichtest du am besten ganz auf Python und schreibst C :)

MfG Diez