Могут ли какие-либо библиотеки Python PDF получить доступ к объектам и группам в существующем файле PDF? - PullRequest
1 голос
/ 06 марта 2012

Я создаю серверное приложение, которое принимает файлы PDF, которые художники экспортировали из Adobe Illustrator. Каждый файл выступает в качестве художественной «колоды», содержащей несколько одинаковых произведений искусства, причем каждый слой является отдельным произведением искусства в колоде.

Я бы хотел иметь возможность программно получать доступ к этим слоям и разделять их на собственные PDF-файлы, в данном случае одностраничные документы. Читать и создавать PDF-файлы довольно легко с такими библиотеками Python PDF, как ReportLab, pyPDF и pyx. Однако ни одна из этих библиотек не позволяет манипулировать существующим PDF на уровне слоя / группы / объекта.

Я что-то пропустил?

1 Ответ

2 голосов
/ 06 марта 2012

Взгляните на pdfminer . Я не очень много его использовал, поэтому не знаю, выполняет ли он то, что вам нужно, но из того, что я видел, он достаточно мощный и является одной из наиболее популярных библиотек Python PDF.

...