Как данные в таблицах измерений и таблицах фактов звездообразной схемы хранилища данных? - PullRequest
0 голосов
/ 04 мая 2011

Я изучаю звездную схему и иерархии атрибутов хранилища данных, и я запутался, потому что примеры из книги не дают примерных данных, на которых можно подтвердить мое понимание вещей.

В книге есть хранилище данных о продажах с измерением для продуктов, которое имеет следующую иерархию атрибутов: ПРОДУКТ (AllProducts, ByProductType, OneProduct)

Смотрите изображение ниже: enter image description here

Какой тип данных будет помещен в таблицу измерений продукта?

Продукты


Все продукты ByProductType OneProduct


? ?

? ?

? ?

Если я не ошибаюсь, атрибуты - это столбцы или поля таблицы, и я не могу понять, как будут выглядеть данные в этой таблице

Если вы берете измерение Time из того же изображения, данные могут быть легко взяты:

TIME


Год Квартал Месяц Неделя


2010 1 1 1

2010 1 1 2

2010 1 1 3

2010 1 1 4

Еще одна вещь, которая меня смущает, это то, как выглядят данные в таблице фактов. В книге утверждается, что таблица фактов намеренно будет содержать дублированные данные. Например, для получения данных о продажах за весь год нет необходимости агрегировать еженедельные значения продаж на лету, поскольку они уже были бы рассчитаны. Теперь, если во временном измерении у меня есть значение первичного ключа 1, которое представляет год, квартал, месяц и неделю одновременно, как я могу хранить совокупное значение 1 за весь год в таблице фактов?

TIME


ID Год Квартал Месяц Неделя


1 2010 1 1 1



SALES_FACT_TABLE


Sales TimeID ProductID


1000 1?

1 Ответ

0 голосов
/ 04 мая 2011

Серые поля (AllProducts, OneProduct и т. Д.) На рисунке являются примерами запросов по измерению продуктов, а не атрибутов.

Атрибутами будут Product.Name, Brand, SKU,InternalName, DevelopmentStartDate, OnMarketDate ... независимо от того,

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...