Каков наилучший способ распознавания основных чисел? - PullRequest
5 голосов
/ 25 декабря 2011

Я бы хотел определить основные английские цифры от 0 до 9, используя простое распознавание текста на Android.Я искал OCR для Android, но он слишком сложен для моей основной цели, есть ли какой-нибудь более простой способ обнаружения цифр на Android?

Ответы [ 2 ]

5 голосов
/ 25 декабря 2011

Простая альтернатива состоит в том, чтобы предварительно определить цифры как растровые изображения и найти их с помощью нормализованной взаимной корреляции.
У этого метода много недостатков:

  • Нет надежности для разных шрифтов
  • Нет устойчивости к шкале чисел
  • ...

Но, возможно, это то, что вам нужно, чтобы просто начать.

3 голосов
/ 26 декабря 2011

Если вы хотите выполнить оптическое распознавание текста с камеры на телефоне, будет сложно использовать предопределенные растровые изображения: фотографии будут сделаны с разным масштабом, они будут содержать шум, будут искажены и т. Д., Так что вряд либудьте достаточно точны.

Если вы разрабатываете приложение для Android, вы, скорее всего, используете Java.Плохая новость в том, что нет собственных SDK для OCR с открытым исходным кодом.Существуют API Java, которые обертывают вызовы для собственных интерфейсов, например, для одного из самых популярных механизмов OCR с открытым исходным кодом - Tesseract (http://groups.google.com/group/tesseract-ocr/)) - есть некоторые Java-оболочки, такие как tesjeract (http://code.google.com/p/tesjeract/) или Tess4J (http://tess4j.sf.net/).), которые могут работатьдля вас, но это довольно сложно настроить и потребует разработки предварительной обработки изображений и обучения шрифтов на вашей стороне.

Еще одним решением может быть облачный сервис. Для подключения к Интернету требуется приложение конечного пользователя., но он не зависит от вашего выбора языка программирования и ограничений ресурсов. Взгляните на ABBYY Cloud OCR SDK , это облачный OCR SDK, недавно выпущенный ABBYY. Он находится в бета-версии, поэтому пока он полностью бесплатныйиспользовать, и он имеет готовые к работе образцы кода Android . Он имеет встроенную предварительную обработку изображений, не требует обучения и просто работает из коробки - вы просто отправляете и снимаете, и получаете ocrКроме того, он имеет функцию распознавания на уровне поля, которая может спасти вам ценный кусоке из небольших ресурсов обработки устройства.Я работаю @ ABBYY и могу предоставить вам дополнительную информацию о наших продуктах, если это необходимо.

...