Приложение для чтения формы документа (scantron-ish) - PullRequest
1 голос
/ 13 июня 2009

Мне нужно создать форму, которая будет заполнена от руки и прочитана в цифровом виде. Я планирую использовать своего рода формат scantron-esque со строками и столбцами, чтобы пользователь мог просто закрасить кружок в соответствующей ячейке, и компьютер узнает это значение на основе положения xy в матрице ячейки. Как адрес Excel.

     | Sys | TV | printer
---------------------------
6/12 |     | X  | 
---------------------------
6/13 |  X  |    | 
---------------------------
6/14 |     |    |   X

Исходя из приведенного выше примера, у меня будет телевизор 6/12, Sys 6/13 и т. Д. Итак, вопрос в том, знает ли кто-нибудь из вас приложение, которое читает такие вещи; что я могу автоматизировать, чтобы прочитать документ и сохранить вывод без вмешательства пользователя? Спасибо


Я поигрался с парой OCR, и они так стараются распознать весь текст на экране, что перепутали макет, заполнив его странными интерпретациями «нечитаемых» символов. Это может быть ответом, но ocr должен был бы позволить мне ограничить то, что он пытается прочитать или отформатировать.

Ответы [ 2 ]

2 голосов
/ 13 июня 2009

Требуется OMR (Оптическое распознавание меток). Не уверен, каков ваш бюджет, но Эбби является одним из лидеров в этом пространстве:

Если вы хотите попробовать свои собственные, я написал эту статью в прошлом месяце

http://www.codeproject.com/KB/showcase/SimpleOMRDotImage.aspx

Он основан на наборе инструментов для компании, в которой я работаю, но объясняет основные концепции, чтобы вы могли попытаться реализовать его с помощью любого имеющегося у вас набора средств обработки изображений.

0 голосов
/ 13 июня 2009

Вы хотите программное обеспечение OCR. Есть несколько бесплатных библиотек для личного пользования (я думаю, что Google спонсирует одну). Возможно, вы захотите поэкспериментировать с макетом, чтобы убедиться, что OCR четко определяет сетку.

Пока вы получаете текст, который позволяет выстроить X в соответствующий ему столбец (например, для столбца TV между X и датой должно быть как минимум 2 нечисловых числа), вы сможете интерпретировать полученный текстовый вывод.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...