Вы можете перейти по ссылкам компании из этой статьи в Википедии:
http://en.wikipedia.org/wiki/Intelligent_character_recognition
Я бы не рекомендовал вам пытаться реализовать решение самостоятельно, особенно если вы хотите выполнить задачу вменее года или двух на полный рабочий день.Было бы прискорбно, если бы неполное решение дало плохое руководство для студентов.
Предупреждение: некоторые компании, которые предлагают коммерческие библиотеки ICR, могут не захотеть поддерживать вас и / или могут не предоставить цитату.Это их право.Однако, если вам неудобно работать с конкретным поставщиком, либо попросите другого контактного лица по продажам и / или сначала попробуйте другого поставщика.
Моя текущая идея - получить одноголиния ширины пикселя для представления обводки, сравните расстояние каждого пикселя от соответствующего пикселя в примере символа, загруженного из базы данных, и выведите, какая область требует наибольшей работы.
Начальный шаг полученияПредставление обводки шириной всего в один пиксель намного сложнее, чем вы думаете.Хотя существуют простые алгоритмы (например, Стентифорд и Чжан-Суен) для выполнения прореживания, пересечения штрихов и неровные края представляют серьезные проблемы.Это классическая (и нерешенная) проблема.Прореживание работает большую часть времени, но когда оно терпит неудачу, оно может терпеть неудачу.
Вы можете работать с библиотекой с открытым исходным кодом, и хотя это поможет вам изучить алгоритмы и их использование, чтобы разработать хорошее решение, которое выПочти наверняка придется копаться в самих алгоритмах и понимать, как они работают.Это требует немного изучения.
Вот несколько книг, которые полезны в качестве вводных учебников:
- Цифровая обработка изображений Гонсалеса и Вудса
- Системы распознавания символов от Cheriet, Kharma, Siu и Suen
- Чтение в мозгу от Станислава Дехаина
ГонсалесВудс - стандартный учебник по обработке изображений.Без каких-либо базовых знаний в области обработки изображений вам будет трудно добиться прогресса.
Книга Cheriet и др. Затрагивает современное состояние оптического распознавания символов (OCR), а также охватывает почеркпризнание.Чем раньше вы прочтете эту книгу, тем быстрее вы сможете узнать о методах, которые уже были опробованы.
Книга Дехина - это читаемое представление о ментальных процессах, связанных с человеческим чтением, и может вдохновить на разработку интересных новых алгоритмов.