[Python-de] urllib vs. httplib

René Liebscher R.Liebscher at gmx.de
Tue Aug 27 11:33:56 EDT 2002


Dinu Gherman schrieb:
> 
> Hallo,
> 
> ich versuche, eine Webseite herunterzuladen, was mit
> urllib klappt, solange ich keine Cookies setzen muss.
> Daher wollte ich auf httplib umsteigen, aber schon ohne
> Cookies scheint es Unterschiede zwischen urllib und
> httplib zu geben, wie folgendes kleine Skript unten
> zeigen soll.
> 
> Fuer photosig.com gibt es diesen seltsamen Unterschied
> (es kommt eine andere "Seite" zurueck), nicht aber fuer
> python.org. Kann sich das jemand erklaeren? Eine ver-
> steckte Abfrage irgendwelcher Kopfzeilen bei photosig
> vielleicht? In einem normalen Browser klappen die URLs
> jedenfalls...
> 
Wird wahrscheinlich die Browserkennung sein.
Wenn ich im Konqueror die Kennung auf WGet 1.5.3 verändere bekomme
ich auch eine andere Seite ( Please do not use offline browsing products
...)

Vielleicht hilft es ja die Browserkennung statt nur "Mozilla"
auf eine der kompletten Kennungen zu ändern z.B.

Mozilla/5.0 (compatible; Konqueror/2.2.1; Linux)
Mozilla/4.0 (compatible; MSIE 6.0; Windows 98; Win 9x 4.90)
Mozilla/4.0 (compatible; MSIE 5.01; Windows 98)
Mozilla/5.0 (Windows; U; Win98; de-DE; rv:0.9.4) Gecko/20011019
Netscape6/6.2
...

Zumindest die Versionsnummer also "Mozilla/5.0" würde ich noch anhängen.

MfG
Rene Liebscher




More information about the Python-de mailing list