Question

В настоящее время я работаю над сканированием счетов с помощью сканирования OCR. Все счета-фактуры используют шрифт «OCRB» и имеют одинаковое форматирование.

Нижняя часть образца счета выглядит следующим образом

Это то, что нужно пользователю для сканирования.

Я пробовал много разных библиотек, чтобы определить, что я хочу. Но большинство библиотек не дает мне правильный результат. Лучший результат - распознавание текста в Firebase ML Vision. Но в результате я получаю следующий вывод:

Я могу рассчитать, верны ли значения, за исключением суммы, представленной в середине. В этом случае он представлен как «3557 00», но если пользователь перемещает камеру немного дальше вправо, я получаю результат «557 00». Поскольку и MLKit, и другие библиотеки встречаются вокруг слова, я понятия не имею, представлена полная сумма или нет.

Если бы я получил один пробел перед словом, я мог бы получить полное слово, в данном случае сумму.

У кого-нибудь есть идеи о том, какую библиотеку использовать для достижения наилучшего результата?

Сканирование счетов с использованием OCR в Swift

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Сканирование счетов с использованием OCR в Swift

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы