Базовый алгоритм подсчета пикселей / ячеек - PullRequest
3 голосов
/ 26 февраля 2009

Спокойной ночи:)

В настоящее время я играю с библиотекой DevIL, которая позволяет загружать изображения и проверять значения RGB на пиксель. Как личный учебный проект, я пытаюсь написать очень простую систему распознавания текста для пары изображений, которые я сделал сам в Photoshop.

Мне удалось удалить все искажения на изображении, и у меня остались текст и цифры. В настоящее время я не ищу продвинутую нейронную сеть, которая учится на входе. Я хочу начать относительно легко, поэтому я решил идентифицировать отдельные символы и подсчитать количество пикселей в этих символах.

У меня две проблемы:

  • Идентификация отдельных символов.
  • Самое главное: мне нужен алгоритм для подсчета подключенных пикселей (того же цвета) без подсчета пикселей, которые я ранее подсчитал. У меня нет математического образования, поэтому это самая большая проблема для меня.

Любая помощь в этом вопросе приветствуется, спасибо.

редактирование:

Я пометил этот вопрос как C ++, потому что это то, что я сейчас использую. Тем не менее, псевдокод или легко читаемый код с другого языка тоже подойдет.

Ответы [ 3 ]

2 голосов
/ 26 февраля 2009

Алгоритм заливки будет работать для подсчета включенных пикселей, если изображения отфильтрованы до простых черно-белых растровых изображений.

Сказав это, вы можете выполнить распознавание символов, сравнивая каждый символ с набором стандартных изображений каждого символа в вашем наборе, измеряя сходство, а затем выбирая персонаж с наибольшим количеством очков.

Посмотрите на этот вопрос для получения дополнительной информации.

1 голос
/ 26 февраля 2009

Извините, если это слишком далеко от темы, но IMHO Vigra (не другая!) ​​- намного лучшая библиотека обработки изображений для C ++, чем DevIL.

1 голос
/ 26 февраля 2009

Не уверен, что это помогает, но есть библиотека OCR GPL, которая называется gocr .

...