Учитывая абсолютно случайное содержимое файла и хороший криптографический хеш, вероятность того, что будут два файла с одинаковым значением хеш-функции, достигает 50%, когда количество файлов примерно равно 2 (количество бит в хэш-функции / 2) , То есть для 128-битного хэша будет 50% -ная вероятность хотя бы одного коллизии, когда число файлов достигнет 2 ^ 64.
Содержимое вашего файла определенно не случайно, но я понятия не имею, насколько сильно это влияет на вероятность столкновения. Это называется атака на день рождения, если вы хотите, чтобы Google для получения дополнительной информации.
Это вероятностная игра. Если количество изображений будет существенно меньше 2 ^ 64, вы, вероятно, в порядке. Если вы все еще обеспокоены, использование комбинации SHA-1 плюс MD5 (как предлагает другой ответ) дает вам в общей сложности 288 высококачественных битов хеша, что означает, что у вас будет 50% вероятность столкновения после того, как там 2 ^ 144 файла. 2 ^ 144 - это очень большое число. Могучий большой. Можно даже сказать, огромный.