Python Скрипт для извлечения всех метаданных и Xobjects из PDF - PullRequest
0 голосов
/ 24 февраля 2020

Наша команда самоучка в Google и YouTube. Мы пытаемся извлечь ВСЕ метаданные из PDF, чтобы включить все xobjects. Мы нашли то, что ищем, используя внутренний отчет о структуре PDF и взглянув на Ресурсы, где есть «шаблон», поскольку это то, что мы действительно хотели бы найти и на какой странице он находится. Мы пытались использовать pdfminer, но это не вернуло то, что нам нужно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...