Python для редактирования PDF - PullRequest
0 голосов
/ 09 апреля 2019

Я хочу отредактировать некоторую информацию в pdf-файле, используя Python. Я пытался использовать Pypdf2 для извлечения текста из файла PDF, но не смог отредактировать его. Кто-нибудь работал над этим раньше?

1 Ответ

1 голос
/ 15 апреля 2019

Я только начинаю что-то похожее (автоматическое редактирование адресов электронной почты и телефонных номеров, к которому затем будут добавлены дополнительные ручные изменения, когда моя подруга работает в школе и в настоящее время делает все это вручную), и быстро доказательство концепции сегодня утром. Я использовал эту библиотеку:

https://github.com/JoshData/pdf-redactor

Изменив пример на наличие подходящего регулярного выражения для электронных писем и изменив замещающий текст на «email redacted», я запустил его и запустил через несколько минут. Очевидно, что еще многое предстоит сделать, но похоже, что редактор pdf сделает большую работу в моем случае - это может быть хорошей отправной точкой для вас?

...