«Предвидение, много и много использования с точки зрения совокупных запросов может быть реализовано»
Это отличительная черта хранилища данных.
Вот трюк с обработкой DW.
Данные являются плоскими. Факты и размеры. Минимальная структура, так как она в основном загружена и не обновляется.
Чтобы выполнить агрегирование, каждый запрос должен быть простым SELECT SUM() or COUNT() FROM fact JOIN dimension GROUP BY dimension attribute
. Если вы сделаете это правильно, чтобы каждый запрос имел эту форму, производительность может быть очень, очень хорошей.
Данные могут храниться в виде простых файлов до тех пор, пока вы не захотите агрегировать. Затем вы загружаете данные, которые фактически собираются использовать люди, и создаете «datamart» из основного набора данных.
Нет ничего быстрее, чем простые плоские файлы . Вам не нужно каких-либо сложностей обрабатывать терабайты плоских файлов, которые (по мере необходимости) загружаются в дейтамарки СУБД для агрегирования и составления отчетов.
Простые массовые загрузки простых таблиц измерений и фактов могут быть ОЧЕНЬ быстрыми с использованием инструментов СУБД.
Вы можете тривиально предварительно назначить все ПК и ФК, используя сверхскоростную обработку плоских файлов. Это упрощает массовую загрузку.
Получите книги Ральфа Кимбалла по инструментам хранилища данных.