Как улучшить результаты тессеракта для распознавания чисел - PullRequest
4 голосов
/ 29 декабря 2010

Я работаю над приложением для iPhone, которое распознает номера ISBN (ISBN: 978-83-7380-900-0). Я использую для этого тессеракт, но он работает не очень хорошо.Я вижу другие приложения, использующие тот же движок для лучшей работы.

для ограничения количества символов, которые я использую в этой строке конфигурации: tess-> SetVariable ("tessedit_char_whitelist", "SN: 0123456789X-");поэтому все «я» преобразуются в «1», а «В» - в 8. Используя это, вы не ошибетесь с этими буквами, поэтому мне это не важно.После этого я использую регулярное выражение, чтобы найти правильную часть распознанного текста.

Я также обрезаю изображение, поэтому tesseract распознает только часть изображения, где виден isbn (я поместил цветной прямоугольник на наложение камеры, поэтомупользователь должен разместить код в правильном месте) Я также изменяю размер изображения до ширины 1000 пикселей (также пробовал другие размеры)

Он работает довольно хорошо при отличном освещении, но действительно трудно распознать правильно, когда освещениене идеально.

Последняя цифра номера isbn является контрольной суммой.

Что я могу сделать, чтобы она работала лучше?Есть ли способ сказать, что tesserect распознает текст только в заданном регулярном выражении?Может быть, мне сначала нужно что-то сделать с изображением?

Примеры изображений, которые не распознаются правильно:
http://img412.imageshack.us/i/img0367si.jpg/
http://img264.imageshack.us/i/img0361d.jpg/

1 Ответ

3 голосов
/ 07 января 2011

Я использовал некоторую предварительную обработку, и результаты на данный момент довольно хороши. (нормализация и автоматический порог) я делаю это с простой обработкой изображения для iphone. Я также делаю изображения с 2-кратным зумом. Единственная проблема заключается в том, что сделать нечеткое изображение действительно легко, а потом невозможно что-либо распознать. Процесс распознавания ocr занимает приблизительно 4 с. и это работает на изображении 300 х 109: 19 КБ Мне просто интересно, что я могу сделать, чтобы это работало быстрее, чтобы я мог взять несколько изображений и обработать все из них.

...