В настоящее время у нас есть 12 различных баз данных, и 7 из них являются размерными.Мы являемся некоммерческой организацией, основанной на знаниях, где у нас есть базы данных, основанные на типе заболевания, которое есть у человека.
например.наши базы данных выглядят как
- ВИЧ
- Гепатит С
- Менингит
и т. д. *
Каждый из них будет иметь данные с таблицами, такими как:
Пациент
Образец (образцы крови)
Местоположение
Диагноз
Пол
Провайдер
Мы не отслеживаем, сколько денег было потрачено, мы просто отслеживаем + ve и -ve семплов.
Теперь вопрос перед высшим руководствомчто мы должны построить Datawarehouse из элеваторов хранения данных.
Но бизнес-пользователи никогда не задавали вопрос, где им понадобятся данные из двух разных баз данных.Нужен ли нам DW, если пользователи даже не думали об этом?
Мне пришло в голову еще несколько вопросов:
- Какая степень детализации для каждого из этих информационных массивов?
- Какое измерение может действовать как согласованное измерение?
- Как будет протекать ETL?
- Добиться единой версии истины для всех мастеров?
Я просто делаю инициативу, чтобы понять, как можно решить ситуацию, в которой мы находимся. Любая помощь приветствуется..
Спасибо