Мне нужно объединить действительно большое количество записей по двум критериям. Скажем для примера, что в записях говорится, в каком городе человек находился ежедневно.
Мне нужно сделать это с очень ограниченным оборудованием и без облака. Я не хочу загружать исходные данные в базу данных для этого, исходные данные действительно большие (думаю, миллиарды записей)
Моя оригинальная идея состоит в том, чтобы построить карту с ключом, идентификатором человека, это будет несколько миллионов, а значение - это карта, где ключом является город, а значением является количество дней, которые они провели в этом городе. Это карта с миллионами ключей, и каждое значение содержит несколько десятых (менее 100) записей.
Я хочу запустить некоторые тесты и мне нужна помощь, чтобы вывести список типов карт, которые я могу использовать: изменяемые / неизменяемые, хэш / дерево ... Мне также нужно сбалансировать производительность с использованием памяти.
Любая помощь будет оценена!