Алгоритм наклонной коррекции для двоичных изображений цифр - PullRequest
1 голос
/ 07 октября 2011

Как часть программы распознавания рукописного текста в автономном режиме, у меня есть большой набор рукописных цифр, написанных примерно 100 людьми чисел от 0 до 9. Перед тем, как получить программу для классификации каждого из изображений, я хочу сделать немного предварительная обработка, чтобы получить их в более стандартной форме.

В настоящее время все изображения представляют собой сетку 64x64, состоящую из 1 и 0 (0 для белого, 1 для черного), но из-за различий в стилях рукописного ввода некоторые числа больше других, некоторые расположены по-другому, а некоторые имеют странные наклоны (как люди нарисовали их в виде диагональных линий)

Я уже примерно понял, как переместить их всех в один и тот же центр и получить их примерно одинакового размера, и я знаю, что для исправления перекоса / наклона мне нужно будет повернуть их на определенную величину. Проблема в том, как узнать, на какую величину повернуть изображения? Есть ли какой-то стандартный алгоритм в нашем ресурсе, на который я мог бы указать, чтобы выяснить это?

1 Ответ

0 голосов
/ 21 октября 2011

Я хотел бы рассмотреть применение алгоритма анализа основных компонентов к пикселям каждого изображения, и это должно дать вам два основных направления линий. Затем вы можете вращаться в соответствии с соответствующей системой координат.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...