Я изучаю звездную схему и иерархии атрибутов хранилища данных, и я запутался, потому что примеры из книги не дают примерных данных, на которых можно подтвердить мое понимание вещей.
В книге есть хранилище данных о продажах с измерением для продуктов, которое имеет следующую иерархию атрибутов:
ПРОДУКТ (AllProducts, ByProductType, OneProduct)
Смотрите изображение ниже:
Какой тип данных будет помещен в таблицу измерений продукта?
Продукты
Все продукты ByProductType OneProduct
? ?
? ?
? ?
Если я не ошибаюсь, атрибуты - это столбцы или поля таблицы, и я не могу понять, как будут выглядеть данные в этой таблице
Если вы берете измерение Time из того же изображения, данные могут быть легко взяты:
TIME
Год Квартал Месяц Неделя
2010 1 1 1
2010 1 1 2
2010 1 1 3
2010 1 1 4
Еще одна вещь, которая меня смущает, это то, как выглядят данные в таблице фактов. В книге утверждается, что таблица фактов намеренно будет содержать дублированные данные. Например, для получения данных о продажах за весь год нет необходимости агрегировать еженедельные значения продаж на лету, поскольку они уже были бы рассчитаны. Теперь, если во временном измерении у меня есть значение первичного ключа 1, которое представляет год, квартал, месяц и неделю одновременно, как я могу хранить совокупное значение 1 за весь год в таблице фактов?
TIME
ID Год Квартал Месяц Неделя
1 2010 1 1 1
SALES_FACT_TABLE
Sales TimeID ProductID
1000 1?