Говоря строго с точки зрения скорости, поиск одиночных, точно совпадающих ключей в прямом хеше в памяти - это почти то, что вы можете получить, если только ваши данные не поддаются размещению в массиве. (т. е. к нему будут обращаться только серии цифровых клавиш, которые образуют в основном непрерывный диапазон, начиная с 0.)
Если у вас есть несколько возможных ключей, по которым вам может потребоваться выполнить поиск (например, как по имени, так и по идентификатору сотрудника), или если вам нужно выполнить поиск, не основанный исключительно на равенстве (например, "Найти всех сотрудников с последними назовите «Смит» »), тогда вы будете значительно замедлены поиском по ключам хеш-функции, и база данных начнет выглядеть намного лучше.
Еще одним фактором общей производительности является то, что вы упомянули, что ваши хэши «хранятся в нескольких файловых папках». Если вы выполняете только один или несколько поисков, считывание хэшей в память из этих файлов также требует времени, что опять-таки склоняет вещи в пользу использования базы данных, что минимизирует количество ненужных данных, которые считываются с диска.
Так что многое зависит от того, как вам нужен доступ к вашим данным и вашим шаблонам доступа.