<p>Hi all, is there anyone on here who has experance dealing with PDF&#39;s in python. Specificaly extracting text from rather badly formatted pdf&#39;s. <br></p>
<p>If so, yay could i rack your brains at some point?</p>
<p>Also if you are going to pycon-au could we grab a coffee?</p>
<p>The long and short is I ask trying to automate the extraction of part of a pdf doc based on the type of job note. After that I want to spell check it and one day I&#39;d like to use NLTK to summarise the notes.</p>
<p>Ambitious much? Any suggestions I&#39;d be grateful.</p>