Как бы вы сравнили файл с десятками тысяч других файлов в БД, чтобы избежать повторной загрузки файла? - PullRequest
0 голосов
/ 13 декабря 2018

Как бы вы подошли к созданию базы данных (Mongo), в которой файл должен сравниваться с десятками тысяч других файлов, чтобы избежать повторяющихся загрузок?

Было бы крайне непрактично сравнивать загруженный файл скаждый второй файл в БД.Я полагаю, что использование метаинформации, такой как хеши, может быть достаточно уникальным.

Достаточно ли уникальны хэши файлов (например, md5 или sha1) для сравнения, или UUID будет лучшим подходом?

База данных будет большой музыкальной библиотекой (если это что-то изменит).

...