Самыми простыми мерами будут подходы, основанные на среднеквадратичной ошибке, например:
Возможно, они совпадают с вашими представлениями о мерах расстояния, но их результаты действительно имеют смысл только в том случае, если у вас уже есть два очень близких изображения, например, если вы смотрите, насколько хорошо конкретная схема сжатия сохранила исходное изображение , Кроме того, один и тот же результат любого сравнения может означать много разных вещей, в зависимости от того, какие существуют артефакты (взгляните на статью, которую я цитирую ниже, для некоторых примеров фотографий RMS / PSNR могут вводить в заблуждение).
Помимо этого, существует целая область исследований, посвященная подобию изображения. Я не эксперт, но вот несколько советов:
Много усилий было уделено подходам, использующим уменьшение размерности (PCA, SVD, анализ собственных значений и т. Д.), Чтобы выделить основные компоненты изображения и сравнить их по разным изображениям.
Другие подходы (в частности, медицинские изображения) используют сегментацию методы, чтобы выбрать важные части изображений, затем они сравнивают изображения на основе того, что найдено
Третьи пытались разработать меры сходства, которые позволяют обойти некоторые недостатки ошибки RMS и PSNR. Была опубликована довольно крутая статья о структурном сходстве в пространственной области (SSIM), которая пытается имитировать восприятие людьми ошибок изображения вместо прямых математических представлений об ошибке. Те же самые ребята сделали улучшенную версию, инвариантную к переводу / ротации, используя вейвлет-анализ в в этой статье о WSSIM .
Похоже, что TinEye использует векторы объектов со значениями для лотов атрибутов для их сравнения. Если вы будете охотиться на их сайте, вы в конечном итоге перейдете на страницу Ideé Labs , и их FAQ имеет некоторые (но не слишком много) особенности алгоритма:
В: Как работает визуальный поиск?
A: Технология визуального поиска в Idée использует сложные алгоритмы для анализа сотен атрибутов изображения, таких как цвет, форма, текстура, яркость, сложность, объекты и области. Эти атрибуты образуют компактную цифровую подпись, которая описывает внешний вид каждое изображение, и эти подписи рассчитываются и индексируются нашим программным обеспечением. При выполнении визуального поиска эти сигнатуры быстро сравниваются нашей поисковой системой для получения визуально похожих результатов.
Это ни в коем случае не является исчерпывающим (это всего лишь горстка методов, с которыми я столкнулся в ходе моего собственного исследования), но если вы ищете технические статьи в Google или просматриваете материалы последних конференций по обработке изображений, вы обязан найти больше методов для этого материала. Это не решенная проблема, но, надеюсь, эти указатели дадут вам представление о том, что происходит.