Редактировать PDF-файл с PDFMiner - PullRequest
1 голос
/ 24 ноября 2011

Мне было интересно, возможно ли отредактировать существующий файл PDF с помощью Pdfminer.Это кажется мощным инструментом, но документация плохая / отсутствует.Я нашел несколько примеров, но они не соответствуют моей цели.Я хочу создать поисковую систему, которая меняет цвет моих ключевых слов в файле PDF.

Ответы [ 2 ]

0 голосов
/ 25 ноября 2011

Нет, pdfminer не поддерживает редактирование.

Однако это может быть намного проще, если вы не пытаетесь изменить pdf, а вместо этого используете PDFOpenParameters: http://partners.adobe.com/public/developer/en/acrobat/PDFOpenParameters.pdf

Вы можете использовать идентификаторы фрагментов URL, например:

http://www.example.com/test.pdf#search=foo

Или даже при открытии Acrobat в командной строке (пример Windows)

AcroRd32.exe /A "search=foo" test.pdf

Вы также можете открыть PDF определенную страницу,и выделите определенную область этой страницы (но не разные области на разных страницах одновременно).

(хорошо, я знаю, что это не совсем решение для вашего вопроса, но если этого достаточно дляваши потребности, это много проще)

0 голосов
/ 24 ноября 2011

PDFMiner предназначен не для изменения существующих файлов PDF, а для извлечения из них текста и метаданных. Наиболее близким решением к тому, что вы ищете с помощью PDFMiner, вероятно, будет использование включенного инструмента pdf2txt.py для извлечения текста, а затем отметьте его, чтобы выделить ключевые слова.

Существует также простая опция - просто использовать средство просмотра PDF со встроенной возможностью находить и выделять несколько поисковых запросов. Я думаю, что Adobe Acrobat может сделать это, но я не уверен в других.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...