Распознавание рукописного текста php - PullRequest
6 голосов
/ 08 августа 2011

Я думаю о создании определенной веб-системы. В нем участвует много разных (случайных) людей, загружающих отсканированные документы, которые они написали.

Существует ли какой-либо PHP-способ с открытым исходным кодом для преобразования этих рукописных текстов в машинный текст?

Я нашел этот вопрос , но хотел бы знать, способен ли он распознавать множество случайных и разных людей?

У кого-нибудь есть опыт, чтобы поделиться этой областью?

Ответы [ 3 ]

2 голосов
/ 08 августа 2011

См. Связанный вопрос по SO: распознавание рукописного ввода с простым обучением

Распознавание рукописного текста на основе изображения также известно как Распознавание рукописного текста в автономном режиме .

Если рукописные символы всегда заглавные буквы, в стиле почтового отделения , они могут обрабатываться с помощью Интеллектуального распознавания символов (ICR) , основанного на изображениях.

Разница между распознаванием в автономном режиме (на основе изображения) и в режиме реального времени (в реальном времени) заключается в том, что последний требует, чтобы вы записывали временную метку (положение и скорость) каждого штриха во время его записи.

Механизм распознавания на основе изображений может обрабатывать данные в режиме онлайн путем преобразования штриховых меток в изображение. Наоборот, он-лайн механизм распознавания не может обрабатывать входные данные на основе изображений. Таким образом, он-лайн распознавание технически проще и доступны проекты с открытым исходным кодом.

Некоторые статьи Википедии содержат списки поставщиков программного обеспечения OCR / ICR:

Пример онлайнового механизма распознавания рукописного ввода (с открытым исходным кодом):

2 голосов
/ 08 августа 2011

я сделал ocr из php используя tesseract-ocr

http://code.google.com/p/tesseract-ocr/

результаты были не такими хорошими, и я сомневаюсь, что это поддерживает почерк но мне было бы интересно посмотреть, что сделали другие

1 голос
/ 08 августа 2011

Это невозможно, поскольку почерк слишком сильно отличается, так что компьютерная программа может найти шаблон для распознавания текста там.Вы можете попробовать с OCR, в идеале с библиотекой, которая хорошо взаимодействует с PHP, например, через оболочку для начинающих.См. Ocrad - GNU OCR .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...