Таблица фактов с различными графиками обновления - PullRequest
0 голосов
/ 13 октября 2010

У меня есть два набора данных с одинаковым уровнем зернистости, например номер счета.Большая часть необходимых данных обновляется ежедневно, поскольку мы учитываем выручку по предыдущим счетам.Однако некоторые из этих данных передаются через отдельную систему калькуляции раз в месяц, а затем передаются в хранилище данных с дополнительной информацией.Должен ли я создать одну таблицу фактов, содержащую оба набора данных, и затем запускать обновление таблицы фактов один раз в месяц, когда импортируются другие данные, или мне следует создать две таблицы фактов из-за разного графика обновления.Данные связаны, и многие запросы (~ 35%) будут запрашивать информацию из обоих наборов данных (при наличии).Система импортирует 30 000 строк в день в таблицу фактов, содержащую около 38 000 000 строк, ежемесячное обновление затронет 660 000 строк.

1 Ответ

4 голосов
/ 13 октября 2010

При условии, что уже существующие меры не будут изменены на втором шаге, вы можете рассматривать таблицу фактов как «накопительный снимок».В таблице описаны процессы с определенным началом и концом - виды рабочих процессов.Найдите его в Kimball's Data Warehouse Toolkit или просто в Google "Таблица фактов накопительного снимка Kimball".

...