Я хотел извлечь данные из PDF, в котором есть изображение, а изображение - это форма, где буква будет находиться внутри маленьких прямоугольников, например, name : t e s t
, здесь каждое слово будет внутри квадратного прямоугольника.
Я пробовал тессеракт OCR не смог получить желаемый результат.
Я пробовал коммерческий ABBYY работал, но я хотел использовать бесплатный API на основе Java.
ниже приведен пример