[Python-de] XML mit LXML einlesen, wobei die Struktur nicht alltäglich ist.

Thomas Gebhard info at tomjones.ch
Di Mär 24 13:18:29 UTC 2009


Andreas Jung wrote:
> 140GB??
>
jeep,
http://www.icwsm.org/2009/data/index.shtml
-> ICWSM 2009 Spinn3r Blog Dataset

> > Die Einträge im XML File beginnen alle mit:
>
> > <item>
> > </item>
> > <item>
> > ....
>
> > dies bedeutet, dass die Files KEIN Root Element enthalten.
>
> Kein Root Element -> Du hast *kein* XML.
>
> Jeder vernünftige XML Parser setzt gültiges XML voraus. Also gibt es
> zwei Möglichkeiten: Du machst aus Deinem Datengrab gültiges XML oder
> Du schreibst Dir einen entsprechenden Parser selbst.
>

Ok, da werde ich dann meine aktuelle Lösung beibehalten.

lg,
tom




Mehr Informationen über die Mailingliste python-de