ICR (интеллектуальное распознавание символов) для автоматической c оцифровки форм - PullRequest
0 голосов
/ 25 февраля 2020

Мы хотим оцифровать формы (язык маратхи). Для этого нам нужны поля формы и соответствующие им значения. Служба Azure «Распознавание форм» и AWS Служба «Textract» не поддерживают язык маратхи. Поэтому мы попробовали Tesseract для этого, но Tesseract не дает вывод в структурированном формате. Как мы должны продолжить вывод Tesseract, чтобы получить пару ключ-значение (form-field, value). Пожалуйста, также предложите инструменты с открытым исходным кодом для того же.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...