обнаружение строк, столбцов в OpenCV (предварительная обработка OCR) - PullRequest
2 голосов
/ 11 февраля 2012

сначала моя последняя цель - обработать следующее изображение с помощью tesseract: http://ubuntuone.com/72m0ujsL9RhgfMIlugRDWP (я уничтожил второй и третий столбцы ...)

Однако у tesseract есть проблемы с точечным фоном,Так что моя идея - предварительно обработать изображение с помощью OpenCV.Лучше всего было бы, если бы я мог как-то обнаружить каждую линию, потому что мне нужно удалить пунктирный фон, применяя иной порог, чем к четным линиям.Есть ли решение, чтобы решить мою проблему?До сих пор я обнаружил преобразование Хафа и, возможно, сегментацию, но результаты были не очень хорошими (возможно, из-за неправильного параметра) ... Но я не уверен, являются ли это возможными подходами и на что я трачу свое время лучше всего.Обнаружение столбца тоже будет хорошо, потому что второй столбец содержит только цифры и третьи символы.Передача этих «знаний» тессеракту может еще больше повысить его скорость обнаружения.

Я был бы очень благодарен, если бы кто-нибудь дал мне несколько советов, как решить эту проблему и какие функции OpenCV лучше всего использовать, с какими параметрами.Также были бы полезны некоторые фрагменты, которые дают мне четкое представление о различных шагах.

Заранее благодарны !!!

С уважением.

1 Ответ

0 голосов
/ 11 февраля 2012

Я бы посоветовал вам использовать что-то вроде эрозии, так как точки кажутся довольно маленькими по сравнению с шириной букв.

ИЛИ Я бы обнаружил обнаружение краев Canny с надлежащими пороговыми значениями, чтобы я отбрасывалдовольно короткие и тонкие края точек.

Надеюсь, это поможет, весело провести время!

...