Программа оптического распознавания символов для фотографий - PullRequest
5 голосов
/ 27 января 2011

Мне нужно разработать программу оптического распознавания символов в Matlab (или на любом другом языке, который может это сделать), чтобы можно было извлечь показания на этой фотографии.

Программа должна иметь возможность загружать как можно большефайлы изображений, насколько это возможно, поскольку у меня есть около 40000 изображений, с которыми мне нужно работать.

Общая цель этой задачи - записать показания газа в течение дня с показанного конкретного газового счетчика.на фотографии.Эта веб-камера в настоящее время настроена так, чтобы запрограммировать каждую минуту показания показаний, и поэтому программа OCR поможет получить исторические данные для считывания газа в течение дня.

Какое программное обеспечение лучше всего подходит для этого и есть лионлайн-источники, доступные для этого ??

Ответы [ 2 ]

4 голосов
/ 28 января 2011

Я бы разбил основные шаги распознавания следующим образом:

  1. Найти показания счетчика на изображении
  2. Изолировать и очистить цифры
  3. Рассчитать характеристики
  4. Классифицируйте каждую цифру, используя обученную модель, используя исторические примеры

При условии, что камера для определенного местоположения не перемещается, шаг 1 необходимо будет выполнить только один раз. Шаг 2 будет включать такие вещи, как усиление контраста и фильтрация шума. Шаг 3 может включать любые полезные вычисления, которые вы можете придумать, такие как среднее значение и перекос «чернильных» (белых) пикселей. Шаг 4 будет использовать модель, которую вы создадите, чтобы классифицировать одну цифру как '0', '1', ... '9', и может быть выполнен с использованием k-ближайших соседей, логистической регрессии, SVM, нейронной сети и т. Д. 1013 *

2 голосов
/ 28 января 2011

Несколько вещей сделают 1 в ответе Predictor простым: установка кулачка прямо над измерителем, добавление достаточного количества света, возможно, размещение ярко-розовых полос вокруг измерителя, чтобы помочь сегментировать дисплей :)

Как только вы это сделаете, и камера останется неподвижной, вы можете один раз использовать ручной процесс, а затем применить его ко всем последующим изображениям, чтобы сегментировать цифры. Если освещение хорошее и стабильное, вы можете просто использовать простое сопоставление с шаблоном для идентификации каждой из сегментированных цифр.

На самом деле, как только вы получите образец всех цифр, вы даже сможете классифицировать их по чему-то более простому (например, по сумме пороговых изображений).

...