Обнаружение вертикального текста, присутствующего в текстовом изображении - PullRequest
0 голосов
/ 08 января 2020

Учитывая изображение, состоящее из текста как в горизонтальной, так и в вертикальной ориентации, я хочу определить, в каком ограничивающем прямоугольнике присутствует вертикальный текст и какова ориентация самого текста соответствующего прямоугольника (сверху вниз или горизонтальной вертикальной линии). Пока что то, что я придумал, помогает только в определении ориентации блока:

Используйте детектор края sobel, чтобы получить края текста, а затем расширить их. Затем я могу выполнить анализ связанных компонентов, чтобы получить границы каждого компонента. Сравнивая ширину и высоту ограничивающего прямоугольника, я мог бы сказать, является ли ориентация прямоугольника горизонтальной или вертикальной (при условии, что текст написан близко, чтобы после расширения я мог получить весь текст как один компонент, а не только один символ на ограничивающий прямоугольник) . [Пример вывода маски расширенного края]

Но это работает только в случае, когда текст написан близко, чтобы быть обнаруженным как один компонент (что, если текст имеет большой размер и имеет большие пробелы среди символов) и говорит только о ориентации прямоугольника.

Я видел много постов и исследовательских работ, но большинство из них обеспокоены случаем, когда весь документ поворачивается под некоторым углом или используя мл. Мне просто нужна некоторая эвристика с использованием обработки изображений, которая помогла бы мне обнаружить вышеуказанное с некоторой разумной точностью.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...