Схема распределения таблиц Факт и Измерение - PullRequest
0 голосов
/ 01 апреля 2020

Я прочитал, что таблица фактов должна быть распределена по "Ha sh Distribution" , а таблица должна быть распределена по "Round Робин " в нескольких сообщениях через inte rnet.

Некоторые из ссылок:

https://www.oreilly.com/library/view/aster-data-database/9781940540221/xhtml/chapter3.html

https://techcommunity.microsoft.com/t5/datacat/choosing-hash-distributed-table-vs-round-robin-distributed-table/ba-p/305247

Но у меня другое мнение, когда речь идет о схеме «звезда» (где одна таблица фактов связана с несколькими таблицами измерений). Таблица фактов должна быть объединена с несколькими таблицами измерений на разных ключах. Поэтому применение хеширования к одному столбцу не будет хорошим выбором, поскольку это оптимизирует объединение только с одной таблицей измерений, но ухудшит производительность соединений с другими таблицами измерений.

Хотя таблица измерений должна связываться с одной таблицей фактов так что распределение sh имеет смысл в таблице измерений.

На мой взгляд, таблица фактов должна быть распределена по round-robin , а таблица измерений должна быть распределена по га. sh схема.

Кто-нибудь может поправить меня, если я ошибаюсь?

...