Это нормально, если оперативное хранилище данных содержит данные за период времени? - PullRequest
0 голосов
/ 07 мая 2018

Мы планируем создать оперативное хранилище данных для требований извлечения данных интерфейсными пользователями. Насколько я знаю подход Кимбалла к созданию ODS \ DW, он должен хранить данные за полный период времени, а не как период времени прокрутки.

Причина в том, что может потребоваться извлечь более старые данные из ODS \ DW.

Так что мне нужны ваши мысли по этому поводу. Как мне подойти?

Ответы [ 2 ]

0 голосов
/ 01 июня 2018

Подход Кимбалла к хранилищу данных будет состоять в том, чтобы загружать транзакционные данные в любое хранилище данных, если это возможно, потому что оно более гибкое в плане свертывания.Конечно, на этапе ODS вы не захотите «предварительно агрегировать» свои данные, если возникнет необходимость получить более старые данные.

Если вы храните как транзакционные данные, так и предварительно агрегированныеверсии данных (в сводных таблицах фактов, с индексами / представлениями или с кубом, или просто фильтрация на стороне отчета, как предлагает другой ответ), вы можете получить лучшее из обоих миров.

(Примечание: Подход Кимбалла на самом деле не требует ODS: они хороши, если вы хотите создать его, но их внимание сосредоточено на хранилище данных с размерным моделированием.)

0 голосов
/ 07 мая 2018

Я бы создал таблицу снимков, которая могла бы содержать значения для скользящего периода для каждого дня, и отфильтровал бы на стороне клиента то, что снимок отображать.

После окончания периода окончательные значения могут быть сохранены в постоянном витрине данных.

...