Есть ли эффективный способ получения отпечатка пальца изображения для обнаружения дубликатов?
То есть, учитывая файл изображения, скажем, JPG или PNG, я хотел бы иметь возможность быстро рассчитать значение, которое идентифицирует содержимое изображения и довольно устойчиво к другим аспектам изображения (например, метаданным изображения ) меняется. Если дело касается изменения размера, это даже лучше.
[Обновить] Что касается метаданных в файлах jpg, кто-нибудь знает, хранятся ли они в определенной части файла? Я ищу простой способ игнорировать это - например. можно пропустить первые x байтов файла или взять x байтов из конца файла, чтобы убедиться, что я не получаю метаданные?