user653861 10 марта 2011 32

PDF-файл с питоном

1 Ответ

sgokhales / 10 марта 2011

Есть нечто, называемое pyPDF.
Это Pure-Python библиотека, построенная как PDF toolkit.

Вы можете извлечь (используя extractText() метод), а также выполнить поиск в файле PDF, используя что-то вроде следующего кода.

pdf = pyPdf.PdfFileReader(file(path, "rb"))
content = pdf.getPage(1).extractText()

...