Я пытаюсь выполнить OCR с тессерактом.Я могу сделать PDF для текста, используя Tesseract Java Java, как и ожидалось.Мои требования теперь немного расширены.Мне нужно извлечь метаданные на основе шаблонной формы (пример паспорта, где у нас есть место для имени, даты рождения и т. Д.).Ввод может быть либо PDF, либо изображение с той же формой шаблона.
Я сталкиваюсь с трудностью найти любой такой пример или статью для достижения или получить дополнительную помощь выше, используя tesseract.
Итак, мои основные вопросы:
- Возможно ли это с помощью tesseract?
- Есть ли примеры / статьи о том, как этого добиться с помощью tesseract?
- Есть ли какое-либо другое программное обеспечение / библиотека, которое рекомендуется для этого?
Спасибодля чтения этого.