Достаточно ли у MD5 места для хэширования файлов отпечатков пальцев? - PullRequest
0 голосов
/ 26 октября 2018

Я ищу быстрое, но не обязательно хорошее хеширование. Я знаю, что MD5 могут быть сломаны или злонамеренно обработаны, но если предположить, что я не использую их для безопасности и только для того, чтобы гарантировать, что файл такой же, как и при первоначальном индексировании, достаточно ли этого?

В какой степени я могу разумно использовать хеширование MD5, прежде чем в среднем возникнет коллизия?

Я хочу хранить записи базы данных как FILE(id,path,size,md5)

Должен ли я сделать md5 уникальным или для этого недостаточно энтропии. Если нет и MD5, то этот хеш будет масштабироваться до такой степени, что я могу для всех намерений и целей назвать его уникальным. Является ли SHA1 адекватным, даже если он медленнее.

У меня есть набор данных с N ~ = 50 000 000

...