Что именно является мерой в схеме «звезда» при проектировании хранилища данных? - PullRequest
0 голосов
/ 01 октября 2011

Звездная схема состоит из таблиц измерений и фактов.

Таблицы фактов содержат внешние ключи для каждого измерения и, кроме того, содержат «меры». Что именно включает в себя эту меру?

Сохраняется ли ответ какой-либо агрегатной функции?

Ответы [ 4 ]

1 голос
/ 01 октября 2011

В основном да.

Если у вас была простая сетка

Salary     Januari   Februari   March   April   May    June
           Q1                         Q2

Me         1100      1100      1100    1100    1500    1500
Collegue1   2000      2000      2000    0       0      0

Время - это иерархическое измерение с двумя уровнями (показано). Другое показанное измерение - «EmployeeID». Другое измерение (не показано) может быть в PointOfView (например, Бюджет / Факт).

Сумма (например, 1100) - это Мера, и она составляет ваши факты (неидентифицирующие части фактов). Измерения определяют функции консолидации для каждой меры на разных уровнях (например, сумма (Q1) == SUM (сумма (январь ... март))). Обратите внимание, что консолидация будет вести себя по-разному в зависимости от меры (например,% от налога на прибыль не будет суммироваться, а будет каким-то образом консолидирован: насколько точно искусство дизайна куба OLAP).

(пустяки: вы можете рассчитать показатели, которые используют MDX для запроса, например, отклонения суммы по сравнению с предыдущим кварталом, средней заработной платы за весь квартал и т. Д.; Будет довольно ясно, что снова формулы консолидации требует мысли).

В этот момент вы начнете видеть, что разработка правил консолидации зависит от порядка, в котором рассчитываются правила (если формула для «отклонения зарплаты%» оценивается ПЕРВЫМ, а затем консолидируется, вам необходимо ее усреднить; однако если исходная мера SALARY сначала консолидируется (суммируется) до уровня Q1, Q2, то производная мера может быть рассчитана так, как если бы она была на самом низком уровне.

Теперь все становится веселее, когда вы решаете, как хранить куб. Существуют два основных способа:

  • рассчитать все ячейки (включая все объединения во всех сценариях)
  • рассчитать на лету

Никого не удивит, что большинство движков OLAP сходятся на гибридных методах (HOLAP), где значительная часть часто используемых уровней консолидации предварительно рассчитывается и сохраняется, а другие части вычисляются на лету.

Некоторые будут хранить базовые данные в стандартной СУБД (ROLAP), а другие - нет (OLAP). Механизмы, ориентированные на высокую производительность, как правило, хранят все данные в предварительно вычисленных кубах (прибегая к «множеству маленьких субкубов» для очень разреженных измерений).

Ну, в любом случае, это было немного напыщенно. Мне понравилось читать то, что я когда-то узнал, занимаясь хранилищем данных и OLAP

0 голосов
/ 01 октября 2011

Меры являются одним из двух видов вещей.

  1. меры. Измерения. Числа с единицами. Доллары, веса, объемы, размеры и т. Д. Измерения.

  2. Заполнители. Суммы (или иногда средние) данных. Это могут быть данные в хранилище: предварительно вычисленные агрегаты по соображениям производительности. Или это могут быть данные, которые не могут быть получены (или не нужны), потому что они слишком подробны. Слишком большой объем или что-то.

Самая важная вещь в таблице фактов состоит в том, что неключевые меры - это фактические измерения с единицами измерения.

0 голосов
/ 01 октября 2011

Если это будет модель смежного дерева, это будет поле заголовка или любое другое поле, содержащее данные.

0 голосов
/ 01 октября 2011

Факт и мера являются синонимами afaik.Факты - это данные: продажи, производство, поставки и т. Д. Размеры - это информация, связанная с фактом (время, место, отдел).

...