У меня есть файл PDF, который выводится процессором OCR, этот процессор OCR распознает изображение, добавляет текст в pdf, но в конце помещает изображение низкого качества вместо исходного (я понятия не имею, почему кто-тобудет делать это, но они делают).
Итак, я хотел бы получить этот PDF, удалить поток изображений и оставить текст в покое, чтобы я мог получить его и импортировать (используя функцию импорта страниц iText)в PDF я создаю себя с реальным изображением.
И прежде чем кто-то спросит, я уже пытался использовать другой инструмент для извлечения текстовых координат (JPedal), но когда я рисую текст в моем PDF, это не так.находится не в той же позиции, что и оригинал.
Я бы предпочел сделать это на Java, но если другой инструмент может сделать это лучше, просто дайте мне знать.И это может быть только удаление изображения, я могу жить с PDF с чертежами там.