[Python-de] Wie an Javascript-generiertes HTML herankommen?

Dinu Gherman gherman at darwin.in-berlin.de
Do Nov 1 10:13:12 UTC 2007


Hallo,

anscheinend verbreitet sich die Unsitte, Teile von Websites
mit Javascript zu erzeugen, damit man sie nicht so einfach
auslesen kann. Beispiel: Man suche in www.versiontracker.com
nach irgendeinem Programm, und man bekommt eine mit JS gene-
rierte Tabelle.

Mit dem DOM-Inspektor in Firefox kann man das vollstaendige
HTML sehen, aber bei einer Abfrage ueber urllib eben nicht.

Gibt es eine funktionierende Moeglichkeit, das rein program-
matisch mit Python hinzubekommen, evtl. unter Verwendung ei-
nes JS-Interpreters? Oder sonstwie? Vielleicht ganz verrueckt:
kann man nicht mit PyPy das JS in Python umwandeln und aus-
fuehren? Hat jemand hier schon so etwas gemacht?

Gruss,

Dinu