Это правильное представление о рабочем процессе BI? - PullRequest
2 голосов
/ 14 сентября 2010

Я новичок в бизнес-аналитике.

Я только что был нанят компанией для завершения своего веб-решения по внедрению модуля BI.После долгих чтений, я думаю, что смогу понять, как выглядит BI-процесс, вы найдете мое представление о BI-процессе.

Подскажите, пожалуйста, правильное ли этовесь рабочий процесс?Если нет, поправьте меня, пожалуйста.Другой вопрос, я не вижу места интеллектуального анализа данных в схеме, где я должен использовать его при необходимости?

Большое спасибо, alt text

1 Ответ

7 голосов
/ 16 сентября 2010

Ниже приведена пара моментов, которые вы можете рассмотреть:

  1. Правильно ли, что уровень представления - это либо Excel, либо веб-служба, и больше ничего? Что если вы хотите развернуть платформу веб-отчетов, такую ​​как SSRS, Cognos, Business Objects, Microstrategy и т. Д.? Эти платформы обычно получают доступ к данным напрямую, без веб-служб.

  2. Возможно, вам потребуется вывести дополнительные данные в простые файлы и нижестоящие базы данных. Данные могут основываться либо на кубе OLAP, либо на исходных данных. Поэтому вы можете включить их в качестве пунктов назначения на уровне основного хранилища данных и на уровне OLAP.

  3. Если вы реализуете уровень веб-презентации, он может находиться не только над кубом OLAP. Вероятно, вы получите запрос на отчет о данных, которые не содержатся в кубе OLAP, и, возможно, не стоит добавлять его только для поддержки нескольких отчетов. Если это так, то вы, вероятно, захотите отметить, что основным хранилищем данных может быть источник для веб-платформы отчетности, а не только OLAP.

  4. Витрины данных обычно не содержат агрегированных данных - они обычно содержат данные уровня детализации. Куб OLAP выполняет агрегирование по подробным данным, но сам базовый киоск данных содержит факты уровня транзакции.

  5. У вас могут быть дополнительные источники данных, импортируемые процессом ETL, такие как веб-службы. Вы также можете подчеркнуть, что существует несколько баз данных и плоских файлов, так же как вы подчеркнули, что может быть несколько витрин данных и кубов OLAP.

  6. Вам не обязательно нужны отдельные витрины данных для кубов OLAP. Если вы строите одно центральное хранилище данных, вы можете создать один центральный куб OLAP и ограничить доступ к измерениям и фрагментам данных на основе ролей безопасности куба.

  7. Вы можете указать, что вам необходимо загрузить промежуточную базу данных перед загрузкой хранилища данных. Возможно, это не так, но, как правило, я рекомендую иметь отдельную промежуточную базу данных, чтобы у вас было место для загрузки до слияния с хранилищем данных. Некоторые процессы ETL могут идти непосредственно в хранилище данных, так как они могут объединяться по пути, но существует множество случаев, когда, вероятно, имеет смысл загрузить данные в промежуточную базу данных перед слиянием в конечный пункт назначения. Это также означает, что ETL / хранимые процедуры, вероятно, должны быть собственной сущностью на диаграмме, поскольку это метод перемещения данных больше, чем назначение или объект. Если вы посмотрите на диаграмму, все ваши сущности являются реальными объектами, а не процессами, такими как MDX.

  8. Вы можете указать, что данные загружаются в витрины данных с помощью процесса ETL. ETL - это не только загрузка хранилища данных, но и перемещение данных на любом этапе. Даже обработка кубов требует процесса ETL.

  9. Ваш сервер OLAP не обязательно должен быть на другом физическом сервере - это может быть служба на сервере базы данных. Это зависит только от того, будете ли вы решать проблемы с производительностью путем увеличения или уменьшения масштаба или намерены опубликовать кубы на нескольких серверах OLAP из-за проблем с географической производительностью.

...