Как моделировать многозначный атрибут в размерной модели - PullRequest
0 голосов
/ 13 апреля 2020

Я работаю над проблемой, когда измерение продукта имеет атрибут с несколькими значениями.

product_dim     
id  name            colours             cost_price
1   Arrow-Shirt     Blue,black          $20
2   Gap-Shirt       Red,Yellow,Black    $25
3   TommyHF Shirt   Blue,White          $21

Здесь строка в product_dim представляет собой один продукт, который был помечен несколькими цветами. Значение атрибута colors является многозначным.

store_dim
id  name        location
1   Amazon      SF
2   Gap Store   Sunnyvale
sales_fact
product_id  store_id    date        quantity    sale_amount  customer_id
1           1           1Jan2020    2           $45          x
1           1           2Jan2020    4           $90          x 
2           2           1Feb2020    2           $55          y
2           2           2Feb2020    4           $120         y
3           5           13Feb2020   9           $220         z

Я хочу ответить на следующие вопросы: 1. Сумма продаж по продуктам синего цвета. 2. Объем продаж на продукты с синим и черным цветами? Должно быть расширяемым для более таких условий. 3. Сумма продаж продуктов синего или черного цветов?

Как мне смоделировать эти размеры? Я знаю, что могу использовать таблицу мостов для цветовых групп, но не знаю, как "и" будут работать условия? Кроме того, есть проблемы с дублированием.

Кроме того, какая модель лучше всего подойдет для Amazon Redshift / Snowflake?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...