Мне нужно проиндексировать множество файлов и папок в базе данных. На одну рабочую станцию будет приходиться около 1000 файлов / папок и около 100 рабочих станций.
Я буду постоянно синхронизировать эти файлы с базой данных, поэтому мне нужно иметь возможность быстро выполнить запрос к базе данных, чтобы увидеть, есть ли файл в базе данных. Я думаю о хешировании полного пути к файлу с помощью MD5 и индексации этого хеш-поля в базе данных. Это правильный подход? Может ли произойти коллизия хешей с 1-10 миллионами записей?
У меня есть выбор MySQL или MongoDB, я склоняюсь к MongoDB, вы согласитесь?