@ Дэнни Шоу, это тоже мой опыт (хотя я относительно новичок в этой области - из ETL, поэтому мне интересно узнать мнение других людей о моем посте).
Я считаю, что важноУважайте, что требования ваших Клиентов меняются вместе с их «зрелостью», и что разные модели могут подходить лучше в разное время.
Мне кажется, что Data Vault обеспечивает эксплуатационную гибкость, тогда как существующие обсуждения (Kimball / Inmon) вращаютсябольше об «гибкости бизнеса» (из-за отсутствия лучшей терминологии).
Data Vault позволяет вам оставаться близко к источнику с точки зрения его гранулярных объектов.Это делает модель «проверяемой» и масштабируемой.Это помогает гибко использовать спецификации SOURCE.
Таким образом, он является полезным промежуточным звеном, например, в проектах миграции, служа основой для подачи более ориентированных на бизнес DWH / Datamarts, которые требуют интегрированного представления обоих старыхи новый.Однако мой опыт показывает, что если вы начнете заполнять Datamarts непосредственно из этой модели, у вас будет много объединений, особенно рекурсий, просто потому, что вы далеки от бизнес-концепций.Не совсем плохо в определенных базах данных, поэтому на выбор частично влияет программное обеспечение (например, Teradata любит присоединяться гораздо больше, чем Oracle).Однако, как правило, я чувствую, что если вам нужна гибкость в TARGET (бизнес), вы в конечном итоге вступаете в дискуссию inmon-kimball, и было бы неплохо начать рассматривать многомерное моделирование вместо хранилища данных на этой стороне.
Таким образом, часть входных данных в вашей оценке также должна быть: насколько стандартизированы бизнес-концепции?Использует ли вся компания одни и те же понятия KPI и Data?Если это не так, то для меня безопасным вариантом будет оставаться близко к источнику (особенно если их много) где-то в вашем хранилище данных.Если вы более зрелы, подготовьтесь к большей гибкости в требованиях к отчетности и перенесите производительность вашей модели данных на сторону отчетности.
Это не означает, что бизнес не может развиваться - просто он должен развиваться каквсе.Я считаю, что это более «зрелый» клиент, который знает, что он может делать со своими данными, имеет очень интегрированный и стандартизированный взгляд на свой бизнес с более и более сложными требованиями в отношении отчетности.Поэтому, если вам нужно моделировать гибкость при подаче данных, и у вас есть мощный набор инструментов ETL, вы также можете напрямую настроить свою модель данных так, чтобы она напоминала бизнес.
Подводя итог, я бы сказал, что каксреда BI становится более «зрелой», бизнес узнал, что он может делать с данными, и требования на этой стороне становятся более сложными.Data Vault не будет подходить на эту сторону.
Однако, если вы находитесь в процессе миграции (особенно с многолетними параллельными фазами) или в более молодой организации, где не все департаменты смотрят на свой бизнес черезте же взгляды, но (в ваших интересах) требования к отчетам довольно заметны, можно было бы использовать хранилище данных заранее и попытаться выяснить, можете ли вы напрямую подавать данные из них - возможно, добавив вкус к измерениям Кимбалла где-нибудьмежду.