Распознавание цифр с помощью тессерактного питона - PullRequest
1 голос
/ 08 октября 2019

В одном из проектов, над которым я работаю, я пытаюсь определить цифры на изображении в лотке для продуктов с помощью OCR. Я использовал Tesseract 4 в Python для этой цели. Но он не может правильно определить номера для большинства изображений, которые у меня есть. Я пробовал различные виды предварительной обработки изображений, такие как размытие, порог, повышение резкости, эрозия и расширение с использованием OpenCV для повышения точности. Но, похоже, ничего не работает. Я новичок в компьютерном зрении, поэтому любые предложения или альтернативные решения для этого будут очень полезны. Я приложил изображения по ссылке ниже. заранее спасибо.

Ссылка на изображения

1 Ответ

0 голосов
/ 10 октября 2019

Вам нужно более сильное обнаружение текста, которое обрезает область текста-кандидата для вас.

Обработка будет немного более сложной, как показано ниже:

  1. Запуск обнаружения текста,получить область, выделенную для текста
  2. Извлечь эту область
  3. Используйте tesseract для чтения текста

Внутри модулей DNN OpenCV есть отличный сценарий обнаружения текста: text_detection.py , который используется для обнаружения текста EAST. Используя ваши образцы изображений, я могу извлечь следующую область текста-кандидата в зеленом прямоугольнике. Таким образом, следующие шаги - вышеупомянутые шаги 2 и 3.

enter image description here

enter image description here

НавернякаEAST не обучен для вашего сценария, поэтому 100% точность невозможна. Вы можете попытаться собрать данные и обучить EAST для вашего сценария. Но я думаю, что по умолчанию даст вам более 90% точности.

Надеюсь, это поможет.

...