Идентификация файла и сохранение идентификатора в mongo db - md5 против имени файла и размера файла - PullRequest
0 голосов
/ 30 октября 2018

Я хочу сохранить информацию о файлах. на данный момент я сохраняю это в mongodb. Мой вопрос: что такое хороший идентификатор файла на моем диске? Файлы - это все изображения - около миллиона. на данный момент я использую

_id = {"name": строка, "size": long}

Я уверен, что никогда не будет столкновения в комбинации имени и размера файлов (в моей коллекции).

А как насчет производительности? Есть ли какое-либо преимущество, кроме коллизий, в использовании хеша, такого как md5?

Создание md5 медленнее, чем получение размера файла? Поиск по md5 или другому хешу быстрее, чем по объекту с 2 полями (я думаю, что mongo создаст хеш объекта id и проиндексирует это?!)

...