Лучшее Раздвижное окно, Извлечение Особенности - PullRequest
0 голосов
/ 14 февраля 2020

В настоящее время я пытаюсь реализовать распознаватель di git для видеопотока Который способен сканировать рукописные цифры на объектах, эти цифры представляют инвентарный номер. Цифры написаны на однородном фоне, поэтому нет резких изменений контраста, за исключением областей с цифрами.

Сначала я реализовал классический подход со скользящим окном, затем я понял, что это замедляет работу в реальном времени. Затем я попытался вычислить пространственную C -мерную (C = классы) карту изображения, следуя подходу «Overfeat», описанному в следующей статье: Ссылка: https://arxiv.org/abs/1312.6229

Теперь я спрашиваю себя, является ли это правильным подходом для решения этой проблемы, может быть, есть решение, где я обрезаю все области изображения, где происходят большие контрастные изменения, потому что очевидно, что в этой области будут содержаться записанные числа?

Заранее благодарю за помощь и время.

...