Компиляция данных SSAS перед обработкой в ​​куб - PullRequest
0 голосов
/ 28 июня 2011

Работа над моим первым проектом SSAS с нуля и надежда на некоторые рекомендации. Я видел разные подходы к переносу данных в куб и задавался вопросом, какой из них предпочтителен, если таковой имеется.

Большинство примеров, через которые я прохожу, просто указывают на таблицы / схемы (скажем, 7 или 8 конкретных таблиц, связанных с продажами) в конкретной базе данных, определяют показатели и измерения и обрабатывают их на основе. Однако я также видел некоторые производственные системы, которые запускают один или несколько SP, чтобы скомпилировать данные из 7 или 8 таблиц, связанных с продажами, в одну или две, которые ближе соответствуют требуемым таблицам фактов. Тогда представления данных куба основаны на них.

Есть ли конкретный подход, который рекомендуется и т. Д.

Заранее спасибо.

1 Ответ

2 голосов
/ 28 июня 2011

Как правило, у нас есть какой-то процесс ETL (Извлечение, Преобразование, Загрузка), построенный либо с помощью sp-s, либо в SSIS, который читает из источника, выполняет манипуляции и затем записывает данные в выделенный datamart звездообразныйсхема.

У этого подхода есть свои преимущества, и единственным недостатком являются связанные с ним трудозатраты, время и затраты.Например, вы можете позаботиться о проблемах качества данных в ETL, назначить соответствующие суррогатные ключи измерений (например, int-ключи) и моделировать такие вещи, как отношения M2M и т. Д.

Сказав это, я также вижу, как многие магазины строяткубы поверх их нормализованной схемы.Вы можете сделать это, как вы упомянули, - использовать несколько таблиц в SSAS или создать представления, которые объединяют все в схеме типа звезды, а затем использовать эти представления в DSV, а затем в SSAS.Обычно я бы рекомендовал этот подход для проверки концептуальных проектов или для вещей, которые действительно не требуют создания своей собственной схемы, поскольку нормализованные таблицы уже содержат данные в подходящем формате.

Если вы строите правильныйРешение SSAS, и у вас есть время и навыки, чтобы сделать это - вы обязательно должны пойти на первый подход.Однако, если эти факторы несколько неопределенны, и вы просто испытываете это, играете с ним и т. Д. - вы можете начать с представлений, а затем заменить их правильной схемой.Таким образом, вы можете научиться делать это без необходимости поддерживать сложные ETL (т.е. вы более гибки).Имейте в виду, что SSAS предпочитает данные в определенном формате, и только построение представлений или использование прямых таблиц несколько ограничивают вас - когда вы чувствуете необходимость, вам следует создать собственную схему.

...