Найти различия между двумя изображениями, но не пиксель за пикселем - PullRequest
4 голосов
/ 05 ноября 2011

Надеюсь, кто-нибудь сможет мне помочь.

У меня есть пары черно-белых изображений, полученных в результате сканирования текстов с помощью большого сканера (размер полученных файлов превышает 500 М).Отсканированные тексты почти идентичны, и мне нужно проверить, есть ли существенные различия.

Очевидно, что я не могу сравнивать пиксель за пикселем, так как одно и то же изображение, отсканированное в bmp, даст мне немного другой результат каждый раз, когда я сканирую.коммерческий - то, что я могу купить или скачать, и построить вокруг него приложение .NET.

Заранее благодарю за помощь.Хелен.

Ответы [ 2 ]

6 голосов
/ 05 ноября 2011

Используйте перцептивное хеширование.Он проверяет, похожи ли два изображения.

Вы также можете вычислить дескриптор объекта, используя один из многих алгоритмов, доступных в open cv, и просто сравнить векторные расстояния.Считайте изображения одинаковыми, если дистанцирование ниже некоторого порога.

Вы можете попробовать GIST, SURF, SIFT и т. Д. (Некоторые из них также инвариантны относительно масштаба и вращения).

0 голосов
/ 05 ноября 2011

Если вы работаете только с текстом, вы можете распознать оба изображения и сравнить извлеченный текст.

...