Question

Изображения, которые я имею, дают мне противоречивые результаты.Мой мыслительный процесс: мой текст всегда белым шрифтом;если я смогу поменять пиксель своего текста на черный и повернуть все остальное на белый или прозрачный, я добьюсь большего успеха.

Мой вопрос: какая библиотека или язык лучше для этого?Должен ли я превратить свой белый пиксель в какой-то уникальный RGB, превратить все остальное в белый или прозрачный, затем найти уникальный RGB и сделать этот черный?Любая помощь приветствуется.

Heitor Boschirolli · Answer 1 · 08 апреля 2019

Да, если бы вы могли сделать пиксели текста черными, а все остальные документы белыми, вы бы добились большего успеха, хотя это не всегда возможно, есть процессы, которые могут помочь.

Медианный фильтр (и другие фильтры нижних частот) можно использовать для удаления шума, присутствующего на изображении.
эрозия также может помочь удалить вещи, которые не являются символами, такие как тонкие линии и шум.
выравнивание текста также хорошая идея, точность распознавания текста может значительно снизиться, если текст не выровнен. Для этого вы можете попробовать преобразование Хафа с последующим вращением. Используйте преобразование Хафа, чтобы найти строку в вашем тексте, а затем поверните изображение под тем же углом, что и линия.

Все упомянутые шаги обработки могут быть выполнены с помощью opencv или scikit-image.

Также хорошо отметить, что есть много других способов обработки текста, слишком много, чтобы упоминать.

Подготовить изображение для распознавания

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Подготовить изображение для распознавания

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы