Бизнес-аналитика - анализировать события, а не совокупности? Какой правильный подход - PullRequest
1 голос
/ 05 февраля 2012

В настоящее время я анализирую данные и тенденции наших клиентов по ряду запросов SQL;и проверка гипотезы может быть дорогостоящим.

Например, у нас есть таблица с информацией о наших клиентах и ​​таблица вызовов для обслуживания клиентов, проиндексированная клиентом.Я хотел бы узнать, было ли у определенной группы клиентов больше проблем с КС, чем у другой;и если есть какая-либо связь между звонками обслуживания клиентов и увеличенными ставками отмены.

Я изучал BI-студию MS, поскольку мы уже работаем с MSSQL 2008;но большая часть того, что я прочитал, фокусируется на тщательно построенных кубах MDX, которые объединяют числовые данные;поэтому в приведенной выше модели мне нужно было бы построить куб фактов (количество вызовов и типов CS), а затем использовать данные клиента в качестве измерений.Справедливо, но за то время, которое потребовалось бы мне для этого, я мог бы просто написать запрос вручную на TSQL.

Моя БД достаточно мала, так что прирост скорости от отдельного datamart не требуется -- то, что я ищу, - это гибкий способ просмотра моих данных путем создания «Объекта» Заказчика и привязки к нему всех видов данных, действий и числовых значений.И я бы предпочел, чтобы данные извлекались из моих существующих таблиц, а не из ETL в отдельную таблицу.

В идеале в какой-то момент я смогу использовать инструменты интеллектуального анализа данных для прогнозного анализа, но сейчас я иду к низко висящим плодам - ​​клиенты из этой рекламной кампании отменяют больше, чем другая;и т. д.

Я лаю неправильное дерево с кубами служб аналитики SQL / MDX?Или то, о чем я говорю, не существует с самого начала?Будем очень благодарны за любые советы, указания по продуктам или понимание.

Ответы [ 2 ]

1 голос
/ 08 февраля 2012

Не тратьте свое время на SSAS / кубики. Ваш набор данных невелик, а объем вашей проблемы узок ... поэтому вам не нужно строить куб. Вместо этого вы должны выполнить тестовый запуск Excel Data Mining . Это довольно мощный и хорошо работает с небольшими наборами данных. Это низко висящий фрукт, который, я полагаю, вы ищете. Кроме того, пользователи чувствуют себя комфортно, используя Excel.

SSAS не требуется для создания структур / моделей интеллектуального анализа данных, необходим только, если вы хотите автоматизировать процесс.

Построение куба сначала помогает, только если у вас очень большой набор данных. Из-за своей скорости, это позволит алгоритмам интеллектуального анализа данных работать быстрее. Даже если вы используете SSAS для построения структуры / моделей анализа данных, вам все равно не нужен куб ... вы можете построить структуру / модель (ы) из реляционных таблиц.

Если таблицы базы данных спроектированы правильно

1 голос
/ 08 февраля 2012

Это зависит от того, кого вы хотите сделать анализ. Если вы тот, кто собирается проводить анализ, вы знаете SQL и понимаете структуру ваших данных, то нет никакой реальной выгоды в том, чтобы выполнять дополнительную работу по простому изменению структуры данных. Вы хотите использовать инструменты BI, когда хотите сделать эти данные доступными для других, кто не знает SQL и не обязательно знает отношения между различными таблицами данных, которые там существуют. По сути, вы добавляете слой абстракции, чтобы скрыть от них всю эту сложность, но все же позволяете им выполнять анализ. Конечно, побочным эффектом абстракции является то, что вы добавляете некоторые ограничения, но компромисс в том, что информация доступна большему количеству людей.

...