Проектирование кораблей отношений для хранилища данных - PullRequest
0 голосов
/ 26 октября 2019

Я собираюсь разработать DataWarehouse для базы данных Northwind, но у моих таблиц клиентов, продуктов и сотрудников есть два общих поля, которые называются страна и город. Я хочу выяснить, правильно ли определять связь между измерением Geo и 3 Other Dimensions согласно форме диаграммы? Если у вас есть какие-либо комментарии, пожалуйста, поделитесь

My DataWareHouse Diagram

1 Ответ

1 голос
/ 27 октября 2019

Это зависит от того, какую философию вы хотите реализовать. Если вы следуете Kimball, вам нужна схема типа «звезда», в которой таблицы фактов связаны с измерениями, а те не связаны ни с чем другим. В этом случае вам лучше оставить геополе в каждом измерении.

Любая избыточность не имеет смысла, так как обычно все объединенные измерения имеют гораздо меньший размер, чем таблицы фактов, вероятно, в нескольких процентных пунктах от общего размера.

С другой стороны, объединение трех таблиц в цепочку намного дороже, чем одно объединение.

Сохранение вычислений ЦП и времени запросов за счет нескольких дополнительных байтов (или килобайт, или мегабайт) обычно является хорошим компромиссом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...