[Python-de] XML processing womit?

Stefan Behnel behnel_ml at gkec.informatik.tu-darmstadt.de
Mit Jan 4 15:16:56 CET 2006


Andreas Pakulat schrieb:
> On 04.01.06 09:08:42, Stefan Behnel wrote:
>> Andreas Pakulat schrieb:
>>> On 03.01.06 20:41:41, Andreas Jung wrote:
>>>> --On 3. Januar 2006 20:37:05 +0100 Andreas Pakulat <apaku at gmx.de> wrote:
>>>>> Weiterhin gefunden habe ich Bindings fuer libxml2, 4suite, jaxml und
>>>>> (c)elementtree.
>>>>>
>>>> Schau Dir mal lxml (codespeak.net/lxml) an.
>>> Jemand ne Idee warum die upstream-Seite nicht zugaenglich ist? Ich habs
>>> mit dem Debian-Source-Paket probiert aber da will der in der lxml README
>>> genannte "Pyrex-0.9.3-gcc4.patch" nicht "applien" und der -small Patch
>>> reicht nicht aus (jedenfalls bricht die lxml Compilierung sofort beim
>>> ersten Source-File ab.
>> Gibt auch nur eins. :)
>>
>> Das Pyrex-Problem hängt damit zusammen, dass das Pyrex Projekt mehr oder
>> weniger tot ist und neue Patches daher nur noch extrem langsam bis gar nicht
>> mehr hineinwandern. Die Umstellung auf GCC4 hat dann echte Probleme bereitet.
> 
> Naja, die Fehlermeldung vom Server sieht eher nach kaputter
> Konfiguration des Apache aus. Nicht nach totem Projekt.

Ich bezog mich auch eher auf die paar Male, die ich bisher Patches an den
Autor weitergeleitet habe, ohne jemals eine Antwort zu bekommen.


> Davon abgesehen: Wieso kann lxml nicht eine Kopie des Pyrex-Tarbals
> anbieten? Muss ja nicht gepatcht sein, original reicht.

Dass da irgendwelche Download-Probleme sind, wusste ich nicht. Aber das hat
nichts mit lxml zu tun. Wie gesagt, etree.c wird in neueren Versionen von lxml
drin sein, damit erübrigt sich das Problem gänzlich.


>> Ich hab mal schnell einen Snapshot von meinem lxml branch gemacht, liegt hier:
>>
>> http://behnel.de/mathdom/lxml-0.8-s2.tar.gz
> 
> Danke fuers Angebot, aber nun laeufts ja hier auch (erstmal).

Ging mir auch weniger um das zum Laufen bringen, als eher um die Features, die
du benutzen möchtest und die API, die dafür bereit steht. Das meiste, was in
letzter Zeit an guten Entwicklungen an lxml stattgefunden hat, hat seinen Weg
noch nicht in eine offizielle Version gefunden, erleichtert aber die Arbeit
und den Einstieg ganz erheblich. Dazu zählen die Unterstützung externer
Funktionen in XSLT und eben auch Namespace-Klassen. Aber ich arbeite dran, 0.9
wird die eierlegende Wollmilchsau. :)

Stefan