Добавление текста в PDF? - PullRequest
       1

Добавление текста в PDF?

0 голосов
/ 14 февраля 2020

Итак, у меня есть шаблон pdf для повестки дня, я хочу знать, как мне определить, где должна быть дата.

Допустим, в шаблоне есть слово «DATE:».

После этого я хочу добавить соответствующую дату / текст рядом с этим пробелом, чтобы я обнаружил «ДАТА:», а после записи он выглядит примерно как «ДАТА: 13/02/2020» и сохранил его как новый файл PDF

1 Ответ

0 голосов
/ 14 февраля 2020

Вы отметили свой вопрос как и . Это делает его очень широким. Поэтому мой ответ также является обобщенным c, а не указанным c. В общем, вы должны решить, какой язык вы запрашиваете.

Для выполнения вашей задачи вам нужно будет сделать две вещи:

  • сначала применить извлечение текста с координатами для ваш pdf, найдите этот маркер DATE в тексте и определите координаты сразу после этого фрагмента текста; некоторые библиотеки допускают ярлыки и имеют подпрограммы, которые извлекают только текст, соответствующий регулярным выражениям и его координатам;

  • , затем добавьте текст к своему контенту по этим координатам.

Ни java, ни python не имеют явной поддержки pdf в своем ядре. Таким образом, для вашей задачи вам нужно будет выбрать библиотеку PDF для этих задач. (Теоретически вы можете попытаться реализовать свои собственные процедуры обработки pdf, но формат pdf довольно сложный, поэтому в общем случае это займет очень много времени.)

Поэтому сначала вы должны проверить, какую библиотеку pdf общего назначения для выбранного вами. язык кажется наиболее подходящим для этих задач и других ваших требований (например, лицензирование). Существует много вопросов и ответов о переполнении стека относительно извлечения текста, которые могут помочь вам в выборе.


Некоторые предупреждающие слова, однако, не все PDF-файлы позволяют правильно извлекать текст. Есть генераторы PDF, которые не добавляют информацию, необходимую для извлечения текста в PDF; некоторые даже добавляют вводящую в заблуждение информацию. Таким образом, вам, возможно, придется отказаться от некоторых шаблонов. В качестве альтернативы, если шаблон является фиксированным, просто определите правильные координаты для вставки текста, измеряя в программе просмотра PDF или методом проб и ошибок.

И если вы по-прежнему влияете на требования, предложите использовать шаблоны с PDF Поля формы AcroForm. Заполнение поля формы предоставляет больше возможностей для дизайнера шаблонов в отношении расположения и оформления заливок, а заполнение легче, чем описанный выше процесс. Если вам не нужны поля формы в полученных PDF-файлах, просто выровняйте формы после заполнения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...