Question

В одном из проектов, над которым я работаю, я пытаюсь определить цифры на изображении в лотке для продуктов с помощью OCR. Я использовал Tesseract 4 в Python для этой цели. Но он не может правильно определить номера для большинства изображений, которые у меня есть. Я пробовал различные виды предварительной обработки изображений, такие как размытие, порог, повышение резкости, эрозия и расширение с использованием OpenCV для повышения точности. Но, похоже, ничего не работает. Я новичок в компьютерном зрении, поэтому любые предложения или альтернативные решения для этого будут очень полезны. Я приложил изображения по ссылке ниже. заранее спасибо.

Ссылка на изображения

Vu Gia Truong · Answer 1 · 10 октября 2019

Вам нужно более сильное обнаружение текста, которое обрезает область текста-кандидата для вас.

Обработка будет немного более сложной, как показано ниже:

Запуск обнаружения текста,получить область, выделенную для текста
Извлечь эту область
Используйте tesseract для чтения текста

Внутри модулей DNN OpenCV есть отличный сценарий обнаружения текста: text_detection.py , который используется для обнаружения текста EAST. Используя ваши образцы изображений, я могу извлечь следующую область текста-кандидата в зеленом прямоугольнике. Таким образом, следующие шаги - вышеупомянутые шаги 2 и 3.

НавернякаEAST не обучен для вашего сценария, поэтому 100% точность невозможна. Вы можете попытаться собрать данные и обучить EAST для вашего сценария. Но я думаю, что по умолчанию даст вам более 90% точности.

Надеюсь, это поможет.

Распознавание цифр с помощью тессерактного питона

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Распознавание цифр с помощью тессерактного питона

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы