[Python-de] Unterschiede htmllib und HTMLParser und Eignung

Andreas Pakulat apaku at gmx.de
Fre Feb 3 23:25:59 CET 2006


Hi,

ich hab da mal ne Frage zu obigen beiden Parsern: Wo liegen da die
Unterschiede? Auf den ersten Blick scheint die "nicht-Ableitung" von
sgmllib der einzige Unterschied zu sein und das htmllib wohl keinen
aktuellen HTML-Standard unterstuetzt?

Ist einer von beiden "schneller" oder fuer das folgende Szenario besser
geeignet oder ists egal?

Ich hab einen HTML-Ausschnitt der von BeautifulSoup bereits "bereinigt"
wurde und will jetzt beim Durchlaufen der Tags einige "weglassen" und
einige evtl. umformen um das ganze dann in einem "Richtext"-UI-Element
anzuzeigen.

Andreas

-- 
You'll feel devilish tonight.  Toss dynamite caps under a flamenco dancer's
heel.