Во-первых, большие объемы данных не всегда хорошо обрабатываются в реляционной базе данных.
Что делают некоторые люди, так это помещают огромные наборы данных в файлы. Обычные старые файлы. Быстрое обновление, простое резервное копирование.
Файлы отформатированы так, чтобы массовый загрузчик базы данных работал быстро.
Во-вторых, никто не анализирует огромные объемы данных. Они редко суммируют 5 000 000 строк. Обычно они хотят подмножество.
Итак, вы пишете простые файловые фильтры, чтобы вырезать их подмножество, загружаете их в «витрину данных» и позволяете им запрашивать это. Вы можете построить все нужные им индексы. Виды, все.
Это один из способов справиться с «хранилищем данных», то есть ваша проблема звучит так.