Создание действия камеры оптимизировано / подходит для распознавания текста - PullRequest
4 голосов
/ 27 января 2012

Я пытаюсь создать камеру для съемки фотографий для распознавания. Вот что я хочу сделать:

  1. Поле с изменяемым размером в середине предварительного просмотра камеры, чтобы указать, какая конкретная область будет создана в растровом изображении и обработана механизмом OCR.
  2. Непрерывный автофокус (сделано)

Кстати, я использую тессеракт.

Если кто-нибудь захочет указать мне некоторые справочные материалы / примеры / учебные пособия, это было бы замечательно.

Ответы [ 3 ]

3 голосов
/ 28 января 2012

Здесь есть прямоугольник видоискателя

https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java

1 голос
/ 29 января 2012

Я делал что-то подобное. Прямо сейчас я просто отправляю всю фотографию в веб-сервис и обрабатываю ее с помощью OCRfeeder , который выполняет сегментацию изображения и отправляет каждую часть с текстом в ней в tesseract. Таким образом я получаю намного лучшую точность. Кроме того, вы можете выполнить некоторую предварительную обработку, чтобы сначала очистить образ.

0 голосов
/ 30 января 2012

Существует два основных подхода.

Вы можете изменить размер изображения перед его отправкой в ​​механизм распознавания.Помните, что используемый вами движок Tesseract имеет какую-то особенность - он требует некоторого пространства между символами и границами изображения, иногда больше, чем ожидалось.

Второй подход заключается в использовании распознавания на уровне поля, когда вы задаете координатытекстового блока и отправьте полное изображение на механизм распознавания текста.Взгляните на http://www.ocrsdk.com, это облачный OCR SDK с веб-API, недавно запущенный ABBYY, он находится в бета-версии, поэтому пока что он бесплатный.Он имеет методы распознавания на уровне поля и Примеры кода Android .Я работаю @ ABBYY и при необходимости могу предоставить дополнительную информацию о наших продуктах

...