Вырожденная ключевая утилита в таблице фактов. Реальный пример - PullRequest
0 голосов
/ 23 марта 2020

Мне нужно поработать над ситуационным исследованием (наборы баз данных OLIT доступны на Kaggle) и мне нужно смоделировать взаимосвязь измерений для анализа панели мониторинга. Идентифицированное зерно - это один продукт на строку заказа (заказ может содержать более одного продукта). Набор данных csv Orders_Items имеет Order_ID (GUID) и Order_Item, которые являются последовательным числом для идентификации количества элементов, включенных в один и тот же заказ.

order_id, " order_item_id ", "product_id", " seller_id», "shipping_limit_date", "цена", "freight_value" 00143d0f86d6fbd9f9b38ab440ac16f5, 1 , e95ee6822b66ac6058e2e4aff656071a, a17f621c590ea0fab3d5d883e1630ec6,2017-10-20 16: 07: 52,21.33,15.10 00143d0f86d6fbd9f9b38ab440ac16f5 2 , e95ee6822b66ac6058e2e4aff656071a, a17f621c590ea0fab3d5d883e1630ec6,2017-10-20 16: 07: 52,21.33,15.10 00143d0f86d6fbd9f9b38ab440ac16f5, 3 , e95ee6822b66ac6058e2e4aff656071a, a17f621c590ea0fab3d5d883e1630ec6,2017-10-20 16: 07: 52,21.33,15.10

Как я могу смоделировать это, чтобы учесть общее количество одинаковых product_id на заказ и правильно составить цену и стоимость фрахта? Вырожденный ключ order_id в таблице Fact_Orders или комбинация order_id + order_item_id? Должен ли я по-другому моделировать и создать таблицу измерений Порядка?

...