[Python-de] Pyton und pdf

Dinu Gherman gherman at darwin.in-berlin.de
Sam Jan 17 15:03:17 CET 2004


Albert Hermeling:

> Hallo Liste,
>
> ich suche jetzt schon eine ganze Weile nach einer Funktion oder 
> Methode die
> PDF Dateien lesen kann und denn darin enthaltenden Text als String 
> ausgib. So
> das man den Text weiterverarbeiten kann.
>
> Kennt jemand so eine Python Funktion?

Nein und gibt es wahrscheinlich auch nicht, ausser ueber Umwege
wie pdf2text oder wie diese Werkzeuge alle heissen... Das Thema
ist komplexer als es scheint, da man im unguenstigsten Fall die
enthaltenen Textteile erst selbst als zusammengehoerend identi-
fizieren muss. D.h. die erwaehnten Werkzeuge sind in der Regel
auch alles andere als perfekt...

Dinu

--
Dinu C. Gherman - http://python.net/~gherman
......................................................................
"If something is repeated over and over as obvious, the chances are
that it is obviously false." (Noam Chomsky)