Я думаю о создании системы базы данных для изображений, где они хранятся с компактными подписями, а затем сопоставляются с «изображением запроса», которое может быть измененной, обрезанной, яркой, повернутой или перевернутой версией сохраненной. Обратите внимание, что я говорю не об алгоритмах подобия изображений, а скорее строго об обнаружении дубликатов. Это сделало бы все намного проще. Система не заботится, если на двух изображениях есть слон, важно определить, действительно ли два изображения одно и то же.
Сравнение гистограмм просто не будет работать для обрезанных изображений запросов. Единственный жизнеспособный путь, который я вижу, - это определение формы / края. Сначала изображения будут как-то дискретизированы, например, каждый пиксель будет преобразован в 8-уровневую шкалу серого. Дискретизированное изображение будет содержать обширные области одного цвета, которые помогут обозначить формы. Эти формы затем могут быть описаны с коэффициентами, и их относительное положение может быть запомнено. Компактные подписи будут производиться из этого. Этот процесс будет выполняться для каждого сохраняемого изображения и для каждого изображения запроса, когда необходимо выполнить сравнение. Это звучит как эффективный и реализуемый алгоритм? Чтобы проиллюстрировать эту идею:
удалена мертвая ссылка ImageShack
Я знаю, что это незрелая область исследований, я прочитал Википедию на эту тему и прошу вас высказать свои идеи по поводу такого алгоритма.