OCR с фиксированными шаблонами на основе форм (например, паспорт) - PullRequest
0 голосов
/ 18 октября 2018

Я пытаюсь выполнить OCR с тессерактом.Я могу сделать PDF для текста, используя Tesseract Java Java, как и ожидалось.Мои требования теперь немного расширены.Мне нужно извлечь метаданные на основе шаблонной формы (пример паспорта, где у нас есть место для имени, даты рождения и т. Д.).Ввод может быть либо PDF, либо изображение с той же формой шаблона.

Я сталкиваюсь с трудностью найти любой такой пример или статью для достижения или получить дополнительную помощь выше, используя tesseract.

Итак, мои основные вопросы:

  1. Возможно ли это с помощью tesseract?
  2. Есть ли примеры / статьи о том, как этого добиться с помощью tesseract?
  3. Есть ли какое-либо другое программное обеспечение / библиотека, которое рекомендуется для этого?

Спасибодля чтения этого.

...