Разбор факсимильной формы - PullRequest
1 голос
/ 02 сентября 2010

Рассматривая сценарий, в котором форма (состоящая только из простых флажков) отправляется по факсу на факс-сервер, способный к распознаванию.Теперь с типографским текстом я вижу, как различные реализации OCR справляются с работой, но я не уверен, как он будет обрабатывать флажки, особенно рукописные «x» или проверки, не говоря уже о координатах.Вернувшись в начальную школу, мы использовали для заполнения этих гауссовых (sic) тестов штриховку HB в правильном ответе;где-то, так или иначе, это было проанализировано и проанализировано.

Где мы находимся сегодня?Есть что-нибудь из коробки?

1 Ответ

3 голосов
/ 04 сентября 2010

Вы имеете в виду технологию Optical Mark Recognition (OMR), обычно используемую Scantron и NCS во многих школах США.

Большинство серверов OCR не имеют реального представления о чтении OMR, если оно специально не предназначено для распознавания различных типов форм. Похоже, что ваше программное обеспечение факс-сервера OCR, вероятно, выполняет только OCR на целой странице и не имеет понятия о полях OMR.

Вы могли бы что-то подстроить, не вкладывая слишком много усилий или затрат. Если вы разрабатываете свои вопросы в соответствии со следующими рекомендациями, это может сработать довольно хорошо.

Какой фрукт ты предпочитаешь есть?
<> Apple
<> Груша
<> Оранжевый
<> Банан

Когда механизм OCR возвращается с текстом OCR, можно предположить, что любые символы, читаемые между символами <и>, являются знаком OMR, даже если это нераспознанный символ.

Какой фрукт вы предпочитаете есть?
<> Apple
Груша
<? > Апельсин
<> Банан

Это будет означать, что Груша и Апельсин были отмечены.

TeleForm - это коммерческий пакет, который может импортировать изображения и обрабатывать страницы факса, но сначала вам нужно будет разработать форму в Teleform. http://www.cardiff.com/products/index.html

...