Я не думаю, что есть какие-либо бесплатные инструменты Python, которые делают именно то, что вы хотите. Вот несколько вариантов:
PoDoFo не имеет зрелых привязок Python, но может читать и записывать PDF-файлы, имеет поддержку изображений PDF и цветовых пространств .
PDFMiner - это анализатор PDF на чистом Python, но он мало работает с изображениями. Это начало, но, вероятно, потребовалось бы немало работы, чтобы сделать то, что вы хотите.
Коммерческая версия ReportLab может делать то, что вы хотите с PageCatcher ; Я не использовал его в течение нескольких лет, но вы могли бы исследовать это. (Бесплатный ReportLab пишет только PDF-файлы, но не читает их.)