Вы в основном задаете вопрос на миллион долларов о том, «Как построить DWH».На самом деле это не тот вопрос, на который можно окончательно ответить.
Тем не менее, вот кикстарт:
Если вы ищете минимально жизнеспособный продукт, знайте, что вы находитесь в среде данных, а не чисто программный.В средах с большим объемом данных постепенно сложнее создать продукт, потому что количество усилий для внесения изменений в систему намного больше.Думайте об этом, как будто каждое изменение, которое вы делаете в программном обеспечении, должно быть как-то обратно совместимо со всем, что вы когда-либо делали.Теперь вы понимаете, к черту Microsoft, в :-).
Кроме того, в системах данных используется множество сторонних инструментов, таких как БД, инструменты ETL и платформы отчетности.Выбор, который вы сделаете, должен быть жизнеспособным для ожидаемого развития вашей системы, иначе вам, возможно, придется полностью заменить эти инструменты в будущем.
Хотя вы можете начать с клонирования БД, которое будет основано на простых копируемых SQL-кодах.и затем, агрегируя или вставляя его в OLAP, я бы с самого начала рекомендовал испачкать руки настоящим инструментом ETL.Это особенно верно, если вы предвидите необходимость роста.В 9 из 10 раз потребность в будет расти.
MS-SQL - хороший выбор для БД, если вы не возражаете против затрат.Естественным инструментом ETL будет SSIS, а также надежный инструмент.
Даже если ваши первые преобразования просто «возьмите эту таблицу и выбросьте ее туда», вы все равно получите много с точки зрения управления процессами (выполнено ли задание? Что произойдет, если оно не выполнится? И т. Д.) И отладки,Кроме того, легче расти органически, поскольку необходимо учитывать требования и / или особые случаи.