Сканирование счетов с использованием OCR в Swift - PullRequest
1 голос
/ 10 мая 2019

В настоящее время я работаю над сканированием счетов с помощью сканирования OCR. Все счета-фактуры используют шрифт «OCRB» и имеют одинаковое форматирование.

Нижняя часть образца счета выглядит следующим образом

enter image description here

Это то, что нужно пользователю для сканирования.

Я пробовал много разных библиотек, чтобы определить, что я хочу. Но большинство библиотек не дает мне правильный результат. Лучший результат - распознавание текста в Firebase ML Vision. Но в результате я получаю следующий вывод:

enter image description here

Я могу рассчитать, верны ли значения, за исключением суммы, представленной в середине. В этом случае он представлен как «3557 00», но если пользователь перемещает камеру немного дальше вправо, я получаю результат «557 00». Поскольку и MLKit, и другие библиотеки встречаются вокруг слова, я понятия не имею, представлена ​​полная сумма или нет.

Если бы я получил один пробел перед словом, я мог бы получить полное слово, в данном случае сумму.

У кого-нибудь есть идеи о том, какую библиотеку использовать для достижения наилучшего результата?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...