Получить размеры и координаты текстовых полей в PDF - PullRequest
5 голосов
/ 06 февраля 2011

Можно ли получить координаты X / Y и высоту / ширину всех текстовых полей в документе PDF с использованием библиотеки PHP или linux? Я использую PDFTK для извлечения всех текстовых полей в PDF, но он не дает мне информацию о координатах и ​​/ или размерах. Если нет, можно ли просмотреть документ PDF и вычислить данные x, y и высоту / ширину для текстовых полей?

Ответы [ 2 ]

0 голосов
/ 07 октября 2011

да, это не так уж сложно.лучший инструмент, который я знаю для работы, это pdfminer .это python, но если вы не хотите использовать python, вы можете просто вывести информацию в формате pdf в формате xml и проанализировать ее с вашим выбором оружия :) ответьте, если у вас возникли проблемы:)

0 голосов
/ 06 февраля 2011

Это возможно, но вряд ли выполнимо.

Вы можете открывать PDF-документы в PHP, используя FPDI .Он генерирует абстрактное дерево объектов PDF в памяти.TCPDF и FPDF могут сохранить его обратно.

Однако обход указанного дерева и поиск правильных атрибутов - это очень.(Я случайно глагол.)

Теперь формат PDF на самом деле удобочитаемый.И это, безусловно, будет содержать координаты в читаемом формате (это в основном в точках IIRC).Таким образом, вы могли бы обнаружить это с помощью простого регулярного выражения, если бы вы только знали, где искать.Некоторые узлы просто необходимо редактировать с помощью gzuncompress (), и вы все равно не пытаетесь изменить документ или сохранить его обратно.Итак, попробуйте FPDI и print_r () для разработки стратегии.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...