У меня есть «PDF-файл с возможностью поиска», также известный как «файлы изображений с невидимым, но выбираемым текстом». (Когда этот файл открывается в Acrobat, меня предупреждает «Вы просматриваете этот документ в режиме PDF / A».)
Мне нужно извлечь ограничивающий прямоугольник каждого слова в этом документе. Какие-либо предлагаемые наборы инструментов и методы для доступа к ограничивающим рамкам слов «invisi-text»?
Я бы предпочел инструменты в Java, но буду благодарен за любые предложения.