OCR с тессерактом, предварительная обработка изображения - PullRequest
0 голосов
/ 31 мая 2019

Мне нужно извлечь цифры из изображений, как показано ниже, я сейчас использую tesseract, но это не работает. Может ли кто-нибудь помочь мне в предварительной обработке изображений перед подачей на тессеракт?

enter image description here

1 Ответ

0 голосов
/ 31 мая 2019

Я не думаю, что tesseract - правильный инструмент для этого, Tesseract может обрабатывать только очень четкие буквы.
Если ваши цифры такие же, как на картинке, вы можете использовать OpenCV ORB детектор https://opencv -python-tutroals.readthedocs.io/en/latest/py_tutorials/py_feature2d/py_orb/py_orb.html
Или, если это не сработает, вы можете использовать какой-нибудь углубленный подход, например SSD Keras или YOLO.
https://github.com/pierluigiferrari/ssd_keras
Другой вариант - расчленить числа (это легко, если все они одного размера) и создать очень простую сверточную нейронную сеть с кератами.
https://keras.io/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...