Я пытаюсь извлечь цифры из типичного табло, которое вы найдете в спортзале средней школы.У меня есть каждый номер в цифровом шрифте «будильника», и мне удалось исправить в перспективе, порог и извлечь данную цифру из видеопотока
Вот пример моего шаблонаinput
Моя проблема в том, что ни один метод классификации не может точно определить все цифры 0-9.Я испробовал несколько методов
1) Тессеракт OCR - этот метод постоянно портит 4 и часто возвращает странные результаты.Просто используя версию командной строки.Если я на самом деле пытаюсь обучить его шрифту «будильника», я каждый раз получаю неизвестный символ.
2) kNearest с OpenCV - я ищу базу данных, состоящую из изображений моего шаблона (0-9) и вижукакой из них ближайшийЯ часто получаю путаницу между 3/1 и 7/1
3) cvMatchShapes - это довольно плохо, обычно оно не может определить разницу между 2 цифрами для каждой входной цифры
4) Tangent Distance - Это самое близкое расстояние, но наименьшее касательное расстояние между входом и моими шаблонами заканчивается отображением «7» в «1» каждый раз
Я действительно в растерянности, чтобы получитьалгоритм классификации для такой простой задачи.Я чувствую, что достаточно хорошо очистил вводные данные, и это довольно простой случай для классификации, но я не могу получить ничего достаточно надежного для практического использования.Будем благодарны за любые идеи о том, где искать алгоритмы классификации или как их правильно использовать.Я не очищаю ввод?Как насчет лучшей входной базы данных?Я не знаю, что еще я использовал бы для ввода, каждая цифра и шаблон выглядят точными в этой точке.