Хранилище данных: избыточные комбинации измерений - PullRequest
0 голосов
/ 02 марта 2012

Я построил собственное, очень простое хранилище данных. В нем у меня очень простые кубики, например:

Факт: обзорRatingByday Размеры: обзор, организация, дата

В моей заявке на стороне OLTP организация имеет отношение 1 к множеству с отзывами.

В настоящее время мое хранилище данных предоставляет функцию извлечения моего факта со всеми возможными комбинациями измерений. Это приводит к избыточным комбинациям, в которых данный Обзор объединяется с Организацией, однако Обзор фактически связан с другой Организацией.

Как другие системы хранилищ данных избегают этого?

Должен ли я отражать мои отношения OLTP в моих измерениях?

1 Ответ

1 голос
/ 05 марта 2012

Я не очень понимаю ваш вопрос. Если в исходных данных не существует некоторых комбинаций Review и Organization, у вас все равно не будет строк для них в таблице фактов. Так где же «избыточная комбинация»?

Я думаю, вы могли бы спросить: "Как я могу показать пользователям только действительные комбинации проверки и организации, когда они выбирают свои критерии отчета". Если это правильно, тогда у вас есть два основных варианта:

  1. Используйте инструмент отчетности, который может представлять пользователю только допустимые комбинации
  2. Объединение Обзора и Организации в одном измерении, которое содержит все допустимые комбинации Обзора и Организации (термин Кимбалла для этого - мини-измерение )

Если я неправильно понял ваш вопрос, пожалуйста, дайте больше информации о том, что именно является вашей проблемой, особенно то, что вы подразумеваете под «избыточной комбинацией».

...