Я выполняю оптическое распознавание текста с использованием Tesseract 2.04 на некоторых изображениях, и теперь мне нужно получить точное положение текста в океане. Но эта версия не возвращает эту информацию.
Мне нужно это для создания PDF-файла с возможностью поиска. Я уже научился штамповать текст в нижнем слое PDF, но мне нужна позиция, чтобы поставить этот текст.
Моя первая идея - выполнить ocr в pdf, получить текст и положение текста, чтобы поставить штамп в pdf с помощью iText api.