Как использовать Opencv для распознавания документов с OCR? - PullRequest
23 голосов
/ 25 сентября 2011

Я новичок в области компьютерного зрения, но я знаю, как использовать некоторые функции в opencv. Я пытаюсь использовать Opencv для распознавания документов, я хочу помочь найти шаги для этого.

Я думаю использовать пример opencv find_obj.cpp, но в документах, например, в паспорте, есть некоторые переменные, имя, дата рождения, картинки. Итак, мне нужна помощь, чтобы определить шаги для этого, и, если возможно, как функцию, которую я должен использовать на шагах.

Я не спрашиваю весь код, но если у кого-нибудь есть ссылка на пример или вы можете просто ввести пошаговое руководство, это очень поможет.

1 Ответ

32 голосов
/ 26 сентября 2011

Здесь есть два совершенно разных шага.Один обнаруживает ваш объект, а другой анализирует его.

Для обнаружения объекта вы просто пытаетесь выяснить, находится ли объект в кадре и приблизительно где он находится.Фреймворк возможностей OpenCv отлично подходит для этого.Некоторые учебные пособия и подробный пример кода см. В учебных пособиях OpenCv features2d и, в частности, в учебнике по сопоставлению функций .

. Для анализа необходимо изучить оптическое распознавание символов (OCR).OpenCv не включает библиотеки OCR, но я рекомендую проверить tesseract-ocr , которая является отличной библиотекой OCR.Если ваши документы имеют фиксированную структуру (согласованное расположение текстовых полей), то tesseract-ocr - это все, что вам нужно.Для более глубокого анализа посмотрите ocropus , который использует tesseract-ocr, но добавляет анализ компоновки.

...