Мы хотим оцифровать формы (язык маратхи). Для этого нам нужны поля формы и соответствующие им значения. Служба Azure «Распознавание форм» и AWS Служба «Textract» не поддерживают язык маратхи. Поэтому мы попробовали Tesseract для этого, но Tesseract не дает вывод в структурированном формате. Как мы должны продолжить вывод Tesseract, чтобы получить пару ключ-значение (form-field, value). Пожалуйста, также предложите инструменты с открытым исходным кодом для того же.