[Python-de] BeautifulSoup contents Listen error

Diez B. Roggisch deets at web.de
Mo Jun 2 09:38:44 UTC 2008


> > Unabhängig von Deinem Problem: XML parst man mit einem XML Parser - nicht
> > mir Beautifulsoup - auch wenn es vorgibt in irgendeiner Form XML parsen
> > zu können. Nimm bitte einer der vielen verfügbaren XML Parser, die es
> > für Python gibt.
>
> Ich hab mich aus zweierlei Gründen gegen einen der eingebauten XML
> Parser entschieden:
> Soup verarbeitet auch nicht standardkonforme xml-Datein, was leider die
> Regel und nicht die Ausnahme ist.
> Soup war schnell und einfach einzubauen.

Was heisst "das ist die Regel"? Sofern du Einfluss darauf hast sollte es nicht 
passieren. Und auf jeden Fall sollte der erste "Griff ins Bibiliotheksregal" 
nach einem echten Parser sein. Wenn das 3rd-party-Sachen sind, dann erstmal 
Korrektheit anmahnen - wenn man sagt, man liefert XML - dann muss man auch 
XML liefern.

Worum es mir geht ist das du den Eindruck erweckst BS zu verwenden weil es ja 
sein *koennte* das das XML nicht konform ist. Das waere aber grundfalsch!

Nur wenn in einer konkreten Situation nix anderes mehr hilft - *dann* mag das 
ok gehen. 

HTML ist da eine andere Sache - weil es eben browserbedingt dort groessere 
Spielraueme gab & gibt.

Diez