В настоящее время я работаю над сканированием счетов с помощью сканирования OCR. Все счета-фактуры используют шрифт «OCRB» и имеют одинаковое форматирование.
Нижняя часть образца счета выглядит следующим образом
Это то, что нужно пользователю для сканирования.
Я пробовал много разных библиотек, чтобы определить, что я хочу. Но большинство библиотек не дает мне правильный результат. Лучший результат - распознавание текста в Firebase ML Vision.
Но в результате я получаю следующий вывод:
Я могу рассчитать, верны ли значения, за исключением суммы, представленной в середине. В этом случае он представлен как «3557 00», но если пользователь перемещает камеру немного дальше вправо, я получаю результат «557 00». Поскольку и MLKit, и другие библиотеки встречаются вокруг слова, я понятия не имею, представлена полная сумма или нет.
Если бы я получил один пробел перед словом, я мог бы получить полное слово, в данном случае сумму.
У кого-нибудь есть идеи о том, какую библиотеку использовать для достижения наилучшего результата?