Замена изображений в документах PDF с Python? - PullRequest
3 голосов
/ 27 апреля 2011

Мы генерируем PDF документы с изображениями RGB, хранящимися в CMS.

В рамках обработки PDF иногда возникает необходимость конвертировать изображения RGB. в CMYK (для печатной продукции).

Преобразование изображений из RGB в CMYK представляется возможным с Python с использованием привязок LittleCMS и PyLittleCMS (плюс цветовые профили ICC для устройства ввода RGB и вывода CMYK).

Однако есть ли какая-нибудь опция на основе Python для перебора изображений внутри PDF, извлечения данных изображения и замены их обработанными вариантами CMYK?

1 Ответ

1 голос
/ 27 апреля 2011

Я не думаю, что есть какие-либо бесплатные инструменты Python, которые делают именно то, что вы хотите. Вот несколько вариантов:

PoDoFo не имеет зрелых привязок Python, но может читать и записывать PDF-файлы, имеет поддержку изображений PDF и цветовых пространств .

PDFMiner - это анализатор PDF на чистом Python, но он мало работает с изображениями. Это начало, но, вероятно, потребовалось бы немало работы, чтобы сделать то, что вы хотите.

Коммерческая версия ReportLab может делать то, что вы хотите с PageCatcher ; Я не использовал его в течение нескольких лет, но вы могли бы исследовать это. (Бесплатный ReportLab пишет только PDF-файлы, но не читает их.)

...