Каков хороший способ найти все вхождения определенной буквы на изображении? - PullRequest
0 голосов
/ 08 декабря 2010

Как, например, найти позиции всех А в пределах .png, независимо от масштаба, но все повернуто правильно?

Редактировать: Правильны те, кто заметил, что это более сложная проблема, чем я ее представляю. Я хотел добавить некоторые детали; Я ищу способ либо найти положение буквы по (отсканированное от руки черно-белому изображению), либо по изображению только буквы найти A-ность (WRT, определенный шрифт) .

Я понимаю, что это большой проект, поэтому мне было интересно, есть ли какие-нибудь библиотеки с открытым исходным кодом, которые делают что-то подобное, или простой алгоритм. Я попробовал несколько схем совмещения углов, но безуспешно.

Ответы [ 2 ]

0 голосов
/ 09 декабря 2010

Что ж, один очень хороший способ сделать это - использовать NGC (не-полутоновая корреляция) с вашим 'A' в качестве модели. Проблема в том, что это не метод инварианта масштаба. На самом деле этот вопрос может быть очень сложным. Чтобы решить несколько масштабов, вы можете сгенерировать модели для каждого масштаба и цикла (медленно).

0 голосов
/ 08 декабря 2010

Во-первых, ваш вопрос относится к области компьютерного зрения (не к обработке изображений, хотя это может показаться непосвященным).Затем, имеет большое значение, является ли изображение png фотографией естественной сцены или отсканированным документом.В случае естественных изображений вам необходимо проверить литературу по обнаружению объектов в целом или обнаружению текста в частности.Для отсканированных документов вашим полем является анализ документов (или обработка документов).

В любом случае, я думаю, что ваша проблема, вероятно, решаема, хотя решение может быть дальше (в усилиях и времени), чем вы могли бы настаивать.

...