У меня есть куча изображений PNG, и я ищу способ идентифицировать дубликаты. Под дубликатами я имею в виду, в частности, два файла PNG, чьи данные несжатого изображения идентичны, необязательно, файлы которых идентичны. Это означает, что я не могу сделать что-то простое, например сравнить значения хэша CRC.
Я полагаю, что это действительно можно сделать надежно, поскольку в PNG используется сжатие без потерь, но меня беспокоит скорость. Я знаю, что могу немного обветшать, сначала проверив одинаковые размеры, но когда приходит время сравнивать изображения друг с другом, есть ли способ сделать это достаточно эффективно? (т. е. быстрее, чем метод "грубой силы" "двойной проверки петель друг против друга"?)