Как бы вы подошли к созданию базы данных (Mongo), в которой файл должен сравниваться с десятками тысяч других файлов, чтобы избежать повторяющихся загрузок?
Было бы крайне непрактично сравнивать загруженный файл скаждый второй файл в БД.Я полагаю, что использование метаинформации, такой как хеши, может быть достаточно уникальным.
Достаточно ли уникальны хэши файлов (например, md5 или sha1) для сравнения, или UUID будет лучшим подходом?
База данных будет большой музыкальной библиотекой (если это что-то изменит).