Как программно прочитать отсканированный документ или изображение - PullRequest
7 голосов
/ 20 декабря 2011

Я искал в сети, потому что я немного n00b, когда дело доходит до OCR, и я на самом деле не уверен, где будет хорошая отправная точка.

Я хотел бы создать приложение, которое сможет определять и подсчитывать, например, например, сколько флажков заполнено в любой строке документа / изображения (это может быть даже другой формат, если кто-то знает о чем-то, что лучше подойдет приложение такого типа). конечной целью является исключение ручного сбора данных и ускорение процесса получения общей статистики для конечного пользователя приложения

Я в основном пишу на c #, поэтому предпочтительнее было бы решение .net, но если нет, я возьму то, что смогу получить.

Что я имел в виду, так это переделать формы, которые пользователи заполняют, примерно так. (извините за грубое искусство ASCII: P), поэтому лицо, заполняющее форму, должно только проверить значение на бумаге.

                |  1  |  2  |  3  |  4  |  5  |  
Product A       | [ ]   [ ]   [ ]   [ ]   [x] |    
Product B       | [ ]   [ ]   [x]   [ ]   [ ] |

любые идеи будут высоко оценены

Спасибо!

Ответы [ 4 ]

6 голосов
/ 21 декабря 2011

1) Вы также можете проверить бесплатный, но очень способный Tesseract OCR-движок.Он написан на C ++, но вы, вероятно, могли бы использовать C # для простого взаимодействия с ним.

2) Если вы хотите выполнить свою собственную обработку изображений, вы можете посмотреть на использование EmguCV библиотека, которая является оболочкой .NET для OpenCV .

Недавно в теге opencv была запись , которая пыталасьчтобы решить проблему, очень похожую на вашу, которая заключалась в обнаружении отметок на карточке лото.

2 голосов
/ 21 декабря 2011

Что вам нужно, это Оптическое распознавание меток (OMR).Если вы планируете коммерческое программное обеспечение, обратите внимание на ABBYY FlexiCapture Engine , это SDK для интеграции технологий сбора данных и документов в серверные, настольные и мобильные приложения.Это не бесплатно, но когда дело доходит до бизнеса - это может добавить серьезную ценность вашему продукту.

Вы также можете использовать облачный сервис - веб-сайт, который позволяет загружать изображения и отправлять вам OCR 'под ред.Попробуйте www.ocrsdk.com , это облачный OCR SDK, недавно выпущенный ABBYY.Сейчас он в бета-версии, поэтому он полностью бесплатен.Для устройства конечного пользователя требуется подключение к Интернету, но оно полностью не зависит от вашего выбора языка программирования и ресурсов устройства пользователя.На github есть примеры .NET и Java .

Отказ от ответственности: я работаю @ ABBYY.

2 голосов
/ 20 декабря 2011

Если все, что вы делаете, это ищите X в коробках, тогда вы можете напечатать форму светло-синим цветом и попросить людей пометить коробки черной чернильной ручкой.

Вы просто сканируете изображение и ищите черные пиксели X. Их должно быть относительно легко найти, по сравнению со светло-голубой формой. Конкретные координаты x, y на отсканированном изображении будут соответствовать ответу и типу продукта соответственно.

2 голосов
/ 20 декабря 2011

Вы можете попробовать использовать библиотеку MODI Office .

Другие варианты

  1. коммерческая библиотека OCR или
  2. реализовать собственную логику распознавания растровых изображений (возможно, если вы полностью контролируете структуру того, что нужно сканировать).
...