Я создаю приложение для распространения среди других ученых. Приложение примет три параметра, которые пользователь отправит, и выведет список дат и кодов, связанных с этими событиями. Я строил это, используя словарь и намеревался построить приложение так, чтобы словарь загружался из файла pickle, когда приложение вызывало его. Параметры, предоставленные пользователем, будут использоваться для поиска необходимого вывода.
Я выбрал эту структуру, потому что я освоился со словарями и файлами рассола, и я вижу, что это выходит за дверь с наименьшей кривой обучения с моей стороны. В словаре может быть до двух миллионов ключей. Я был доволен производительностью моей машины с разумным подмножеством. Я уже подумал о том, как разбить словарь на части, если у меня возникнут проблемы с производительностью, когда все это соберется вместе. Меня не особо беспокоит объем дискового пространства на их компьютере, поскольку мы работаем со значениями в терабайтах.
Сказав все это, я копался в документах, и мне интересно, нужно ли мне потратить некоторое время на изучение и внедрение альтернативного файла хранения данных. Единственная причина, по которой я могу придумать, заключается в том, что существует альтернатива, которая может увеличить скорость поиска в три-пять раз или более.