7-сегментный дисплей OCR - PullRequest
       14

7-сегментный дисплей OCR

12 голосов
/ 20 февраля 2012

Я создаю приложение для iOS (сделайте снимок и запустите на нем OCR), используя Tesseract (библиотека OCR), и оно очень хорошо работает с хорошо написанными цифрами и символами (с использованием обычных шрифтов).

Проблема, с которой я столкнулся, заключается в том, что, если я попробую это на 7-сегментном дисплее, это даст очень и очень плохие результаты.

Итак, мой вопрос: кто-нибудь знает, как я могу решить эту проблему? Есть ли у Тессеракта способ распознать этих персонажей?

Ответы [ 2 ]

9 голосов
/ 12 мая 2012

Мне тоже было очень трудно заставить тессеракт распознавать цифры на изображениях ЖК-дисплеев.

Я добился некоторого незначительного успеха, предварительно обработав изображения с помощью ImageMagick для наложения копии изображения на себя с небольшим вертикальным сдвигом для заполнения промежутков между сегментами:

$ composite -compose Multiply -geometry +0+3  foo.tif foo.tif foo2.png

В итоге, однако, моей спасительной льготой был двоичный файл " Оптическое распознавание семи сегментов ": http://www.unix -ag.uni-kl.de / ~ auerswal / ssocr /

Большое спасибо автору Эрику Ауэрсвальду за этот код!

2 голосов
/ 20 февраля 2012

Я не пробовал 7-сегментное отображение OCRing, но подозреваю, что проблема может быть вызвана тем, что символы не являются подключенными компонентами.Tesseract не очень хорошо справляется с отключенными шрифтами из моего опыта.

Простая эрозия (предварительная обработка изображений) может помочь при соединении сегментов, но вам придется протестировать его и поиграть с размером ядра, чтобы избежать слишком большого искажения.

...