Перевернутое изображение документа - PullRequest
0 голосов
/ 30 апреля 2020

У меня есть набор данных OCR идентификаторов паспортов. Изображения могут быть случайно повернуты в наборе данных (под любым углом).

Каков наилучший способ получения изображения в горизонтальной плоскости (это должно помочь сети более точно определять символы)?

Самый простой способ - это подготовить NN для этого, но я уверен, что для этой задачи должны быть классные c подходы для компьютерного зрения.

1 Ответ

0 голосов
/ 01 мая 2020

Идентификатор паспорта в настоящее время нормализован.

Попробуйте найти темные объекты по размеру персонажа и сгруппировать их по геометрии c расстояния (хороший прием - это вычислить минимальное остовное дерево, но это немного технически).

Из графика отношений соседства символов вы должны быть в состоянии определить доминирующую ориентацию и реконструировать строки.

Я не знаю ни одного готового решения, которое реализует это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...