Программное обеспечение OCR или самодельный CNN для обработки документов? - PullRequest
0 голосов
/ 01 октября 2018

У меня дилемма.Если у вас есть только один тип счета-фактуры / документа, и у вас есть определенное поле, которое вы хотите обработать из этого счета-фактуры и использовать где-то еще (это поле представляет собой рукописную цифру, иногда написанную тире или косой чертой), вы бы использоваликакое-то программное обеспечение для распознавания текста или создать свой собственный CNN для распознавания цифр?Какую точность вы ожидаете от OCR?Будет ли ваш CNN более точным, поскольку вы просто заинтересованы в конкретном типе записи цифр, с определенными размерами изображения и т. Д. Что было бы лучше в данной ситуации?Имейте в виду, что вы не будете использовать его каким-либо иным способом или в любом другом месте для распознавания рукописных цифр, и у вас уже есть до 100 000 и более документов, которые человек скопировал на компьютер, и вы можете использовать его дляобучение и тестирование.

Спасибо.

1 Ответ

0 голосов
/ 01 октября 2018

Я бы определенно пошел на решение на основе CNN.Поскольку структура вашего документа непротиворечива:

  1. Извлеките нужную часть документа с помощью стандартного подхода компьютерного зрения
  2. Обучите CNN аннотированному набору из нескольких тысяч документов.Вы даже должны иметь возможность точно настроить существующий CNN, обученный на MNIST, и для этого потребуется меньше обучающих образов.

Этот подход должен обеспечить точность> 99% без особых усилий.Точность решения OCR действительно зависит от того, какую библиотеку вы используете и какую предварительную обработку вы выполняете.

...