Я работаю над проблемой, когда измерение продукта имеет атрибут с несколькими значениями.
product_dim
id name colours cost_price
1 Arrow-Shirt Blue,black $20
2 Gap-Shirt Red,Yellow,Black $25
3 TommyHF Shirt Blue,White $21
Здесь строка в product_dim представляет собой один продукт, который был помечен несколькими цветами. Значение атрибута colors является многозначным.
store_dim
id name location
1 Amazon SF
2 Gap Store Sunnyvale
sales_fact
product_id store_id date quantity sale_amount customer_id
1 1 1Jan2020 2 $45 x
1 1 2Jan2020 4 $90 x
2 2 1Feb2020 2 $55 y
2 2 2Feb2020 4 $120 y
3 5 13Feb2020 9 $220 z
Я хочу ответить на следующие вопросы: 1. Сумма продаж по продуктам синего цвета. 2. Объем продаж на продукты с синим и черным цветами? Должно быть расширяемым для более таких условий. 3. Сумма продаж продуктов синего или черного цветов?
Как мне смоделировать эти размеры? Я знаю, что могу использовать таблицу мостов для цветовых групп, но не знаю, как "и" будут работать условия? Кроме того, есть проблемы с дублированием.
Кроме того, какая модель лучше всего подойдет для Amazon Redshift / Snowflake?