Как найти пустое поле на отсканированном изображении документа - PullRequest
2 голосов
/ 14 февраля 2009

Я хочу, чтобы моя заявка заполнила одно поле в форме, которая существует как черно-белый файл изображения. Форма всегда начинается с той же бумажной версии, но к тому времени моя приложение получает его от моих пользователей, возможно, оно было отсканировано или отправлено по факсу чем один раз. Из-за этого нужное поле находится не в одно и то же место в каждом файле.

Мои пользователи не всегда получают пустую форму от меня, поэтому я не иметь возможность напечатать отметку или заполнитель, который я могу узнайте позже.

В оригинальном бланке есть текст, но он может был отправлен по факсу, у меня есть только разрешение 200 dpi. Текст всегда достаточно велик для человека, чтобы читать, но я скептически об OCR.

У меня есть бюджет, поэтому мне не нужно бесплатное решение ... давайте просто скажи $ 2000.

Тем не менее, я рассматриваю

  1. Получить решение для распознавания текста, чтобы найти текст ярлык на поле мне нужно. я не буду думаю, у меня есть ресурсы или экспертиза, чтобы катиться самостоятельно. я не буду нужно идеальное признание, так как я уже знаю, что говорит текст. Но мне нужно знать X- и Y-координаты. Есть ли программное обеспечение что это делает? Или программирование проще, чем я думаю?

  2. Сборка или покупка программного обеспечения для распознавания края формы. Оттуда, Я мог бы получить относительную позицию поле мне нужно. Я думал о пунктирная линия, которую мое программное обеспечение сканера помещает вокруг изображения маленький документ. Это известный Алгоритм или есть в наличии решение?

  3. Какой-то другой способ распознать поле мне нужно. Попытки Google программное обеспечение для заполнения формы, дайте мне сотни совпадений для веб-форм, PDF формы и т. д., которые не делают то, что я необходимо.

Я не разборчив в языке. Мое приложение работает на Linux, но если лучшим решением будет Microsoft, я, вероятно, смогу это сделать.

Буду признателен за ваши мысли.

Ответы [ 3 ]

4 голосов
/ 14 февраля 2009

Если я правильно понимаю, форма всегда одна и та же, но может быть смещена, масштабирована или слегка повернута из-за фотокопирования / отправки по факсу. В этом случае ваша проблема - одна из регистрация изображений : найдите оптимальное жесткое преобразование, которое превращает форму из пользовательской линии в форму вашей «модели», в которой вы знаете местоположение интересующей области , Как только вы знаете преобразование, вы можете вычислить расположение поля в форме пользователя.

Существует много алгоритмов регистрации изображений, обычно разработанных для таких приложений, как выравнивание МР-изображений мозга. Они вычислительно дорогие и требуют статистических априоров. К счастью, ваш случай проще: все, что вам нужно сделать, это поместить прямоугольник вокруг содержимого пользовательской формы. Координатный спуск должен работать. Вам понадобится некоторая терпимость к шуму (мусор вне формы).

0 голосов
/ 19 февраля 2015

Жесткой регистрации может быть недостаточно. Пользователи могут изменить макет и форматирование формы шаблона, например изменить шрифты, изменить расположение флажка или поля ввода, разбить абзац в разных позициях новой строки и т. Д. С этими различиями сложнее справиться, чем с чистым сдвиг, вращение или преобразование масштаба. Кроме того, если ваше изображение является двоичным (черно-белым), я не думаю, что эти алгоритмы регистрации медицинских изображений (работающие с изображением в градациях серого) сильно помогут. Ваша функция затрат и стратегии минимизации могут быть изменены соответствующим образом.

0 голосов
/ 14 февраля 2009

Вот небольшая сводка некоторых доступных решений для распознавания текста (с открытым исходным кодом и нет): http://googlesystem.blogspot.com/2007/04/open-source-ocr-software-sponsored-by.html

...