Схема «снежинка» лучше, чем схема «звезда» для интеллектуального анализа данных? - PullRequest
4 голосов
/ 26 июля 2011

Я знаю основное различие между схемой «звезда» и схемой «снежинка»: схема «снежинка» разбивает таблицы измерений на несколько таблиц, чтобы их нормализовать, схема «звезда» имеет только один «уровень» таблиц измерений. Но в статье Википедии для Snowflake Schema написано

"Некоторые пользователи могут пожелать отправлять запросы к базе данных, которые, используя обычные многомерные инструменты отчетности, не могут быть выражены в простой схеме типа« звезда ». Это особенно часто встречается при извлечении данных из баз данных клиентов, где общим требованием является поиск общих факторы между клиентами, которые купили продукты, отвечающие сложным критериям. Как правило, некоторые снежинки должны были бы позволять простым инструментам запросов формировать такой запрос, особенно если предоставление этих форм запросов не ожидалось, когда хранилище данных было впервые разработано. "

Когда было бы невозможно написать запрос в схеме «звезда», который мог бы быть записан в схеме «снежинка» для тех же базовых данных? Кажется, что схема типа «звезда» всегда разрешает одни и те же запросы.

Ответы [ 2 ]

6 голосов
/ 26 июля 2011

Для интеллектуального анализа данных вам почти всегда приходится подготавливать данные - в основном, как одну "плоскую таблицу".

Это может быть запрос, подготовленный просмотр или экспорт CSV - зависит от инструмента и ваших предпочтений.

Теперь, чтобы правильно понять эту статью, вероятно, придется курить и пить то же, что и автор, когда он / она пишет.

0 голосов
/ 11 февраля 2015

Как вы упомянули, подготовка плоской таблицы для интеллектуального анализа данных, начиная с реляционной базы данных, является непростой задачей, и схема «снежинка» или «звезда» работает только до определенной точки.

Однако существует программное обеспечениес именем Dataconda , который автоматически создает плоскую таблицу из БД.

По сути, вы выбираете целевую таблицу в реляционной базе данных, и dataconda «расширяет» ее, добавляя к ней тысячи новых атрибутов;эти атрибуты получены путем выполнения сложных запросов, включающих несколько таблиц.

...