Question

Я хочу, чтобы моя заявка заполнила одно поле в форме, которая существует как черно-белый файл изображения. Форма всегда начинается с той же бумажной версии, но к тому времени моя приложение получает его от моих пользователей, возможно, оно было отсканировано или отправлено по факсу чем один раз. Из-за этого нужное поле находится не в одно и то же место в каждом файле.

Мои пользователи не всегда получают пустую форму от меня, поэтому я не иметь возможность напечатать отметку или заполнитель, который я могу узнайте позже.

В оригинальном бланке есть текст, но он может был отправлен по факсу, у меня есть только разрешение 200 dpi. Текст всегда достаточно велик для человека, чтобы читать, но я скептически об OCR.

У меня есть бюджет, поэтому мне не нужно бесплатное решение ... давайте просто скажи $ 2000.

Тем не менее, я рассматриваю

Получить решение для распознавания текста, чтобы найти текст ярлык на поле мне нужно. я не буду думаю, у меня есть ресурсы или экспертиза, чтобы катиться самостоятельно. я не буду нужно идеальное признание, так как я уже знаю, что говорит текст. Но мне нужно знать X- и Y-координаты. Есть ли программное обеспечение что это делает? Или программирование проще, чем я думаю?
Сборка или покупка программного обеспечения для распознавания края формы. Оттуда, Я мог бы получить относительную позицию поле мне нужно. Я думал о пунктирная линия, которую мое программное обеспечение сканера помещает вокруг изображения маленький документ. Это известный Алгоритм или есть в наличии решение?
Какой-то другой способ распознать поле мне нужно. Попытки Google программное обеспечение для заполнения формы, дайте мне сотни совпадений для веб-форм, PDF формы и т. д., которые не делают то, что я необходимо.

Я не разборчив в языке. Мое приложение работает на Linux, но если лучшим решением будет Microsoft, я, вероятно, смогу это сделать.

Буду признателен за ваши мысли.

Vebjorn Ljosa · Answer 1 · 14 февраля 2009

Если я правильно понимаю, форма всегда одна и та же, но может быть смещена, масштабирована или слегка повернута из-за фотокопирования / отправки по факсу. В этом случае ваша проблема - одна из регистрация изображений : найдите оптимальное жесткое преобразование, которое превращает форму из пользовательской линии в форму вашей «модели», в которой вы знаете местоположение интересующей области , Как только вы знаете преобразование, вы можете вычислить расположение поля в форме пользователя.

Существует много алгоритмов регистрации изображений, обычно разработанных для таких приложений, как выравнивание МР-изображений мозга. Они вычислительно дорогие и требуют статистических априоров. К счастью, ваш случай проще: все, что вам нужно сделать, это поместить прямоугольник вокруг содержимого пользовательской формы. Координатный спуск должен работать. Вам понадобится некоторая терпимость к шуму (мусор вне формы).

John Chain · Answer 2 · 19 февраля 2015

Жесткой регистрации может быть недостаточно. Пользователи могут изменить макет и форматирование формы шаблона, например изменить шрифты, изменить расположение флажка или поля ввода, разбить абзац в разных позициях новой строки и т. Д. С этими различиями сложнее справиться, чем с чистым сдвиг, вращение или преобразование масштаба. Кроме того, если ваше изображение является двоичным (черно-белым), я не думаю, что эти алгоритмы регистрации медицинских изображений (работающие с изображением в градациях серого) сильно помогут. Ваша функция затрат и стратегии минимизации могут быть изменены соответствующим образом.

ChrisW · Answer 3 · 14 февраля 2009

Вот небольшая сводка некоторых доступных решений для распознавания текста (с открытым исходным кодом и нет): http://googlesystem.blogspot.com/2007/04/open-source-ocr-software-sponsored-by.html

Как найти пустое поле на отсканированном изображении документа

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как найти пустое поле на отсканированном изображении документа

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы