Выполнение OCR на газовом счетчике - PullRequest
0 голосов
/ 09 октября 2018

Я хочу выполнить OCR на газовом счетчике, чтобы он мог прочитать значение.Пример счетчика, на котором я хочу выполнить OCR:

Meter

В этом случае OCR должен вернуть 25539144.

Как выЯ вижу, что есть небольшая проблема: вокруг метра много текста.Таким образом, обычная библиотека OCR здесь не будет работать, поскольку она также будет возвращать текст вокруг нее.

Я уже пробовал обнаружение объекта, чтобы обнаружить измеритель, но единственное, что, кажется, работает хорошо (потому что у меня есть только 50 изображений), это лазурные когнитивные сервисы.Проблема в том, что позже он сможет обнаружить его в прямом эфире, поэтому веб-сервис будет невозможен.

Может ли кто-нибудь помочь мне в правильном направлении для решения этой проблемы?

1 Ответ

0 голосов
/ 09 октября 2018

Если комментарий об использовании цвета вам не поможет, то вы можете попробовать этот подход:

Один из возможных подходов - тренировать модель (возможно, NN), чтобы нарисовать ограничивающую рамку вокруг использования.числа.

Вам нужно будет нарисовать несколько блоков вручную, чтобы предоставить примеры обучения.

После того, как вы запустите эту "модель создания ограничивающего прямоугольника", вы можете обрезать всененужные вещи, и у вас будет новый учебный набор, состоящий из примеров, из которых легче учиться.

Затем вы можете попробовать переобучить свою модель ocr на этом новом наборе данных.

...