DataWarehouse - Что такое хорошее определение? - PullRequest
2 голосов
/ 21 мая 2010

Может ли кто-нибудь дать мне хорошее практическое определение того, что такое хранилище данных?

Ответы [ 5 ]

3 голосов
/ 21 мая 2010

Я только начал работать с Datawarehousing и Buisness Intelligence, и, просматривая веб-страницы, вы можете найти несколько интересных ссылок:

Я думаю, что эти две ссылки могут помочь вам понять концепции хранилища данных.

извините, я новичок, я могу опубликовать только одну ссылку ^^

мы сожалеем, но как механизм предотвращения спама, новые пользователи могут публиковать не более одной гиперссылки.Заработайте 10 репутации, чтобы публиковать больше гиперссылок.

2 голосов
/ 21 мая 2010

Я удивлен, что никто не опубликовал Определение Инмона :

Склад является предметно-ориентированным, интегрированный, изменяющийся во времени и энергонезависимый сбор данных в поддержка решения руководства процесс изготовления

На этой же странице вы можете получить определение Кимбалла:

Копия данных транзакции специально структурированный для запроса и анализ

Я думаю, что, к сожалению, хранилище данных - это обширная область. Существует много разнообразия и очень мало стандартных парадигм, в частности, я думаю о трехмерном моделировании Кимбалла. У Инмона нет такой специфической методологии, как у Кимбалла, и поэтому некоторые модели 3NF могут соответствовать или не соответствовать его принципам.

Поскольку Inmon расширил сферу своих возможностей для целей складирования, он может охватывать неструктурированные данные. Однако анализ неструктурированных данных сильно отличается от традиционного анализа.

Применительно к SQL Server, как правило, самые большие хранилища данных на SQL Server моделируются по размерам, поскольку это хорошо подходит для нераспределенной, не массово параллельной модели. Массивно параллельные системы, такие как Teradata, обычно работают намного лучше с 3NF-моделями. Это все еще основанные на таблицах системы с различными таблицами, связанными с ограничениями внешнего ключа (возможно, не принудительно, но по крайней мере логично).

Конечно, мы также видим системы обработки данных NoSQL, такие как Map / Reduce, которые на самом деле не являются базами данных в смысле нормализованных, денормализованных или ненормализованных реляционных баз данных, которые у нас уже 40 лет.

1 голос
/ 21 мая 2010

База данных, оптимизированная для извлечения, как правило, денормализованных данных, обычно звездообразной схемы (но может быть и снежинкой) и использует многомерное моделирование (таблицы фактов и измерений)

0 голосов
/ 08 сентября 2014

Определение: Datawarehouse - это база данных, используемая для целей анализа, а не для обработки транзакций.

Для получения дополнительной информации о хранилище данных см. Ссылку ниже

http://www.idatastage.com/datawarehouse/

0 голосов
/ 13 июля 2010

Хотя это не академическое определение, оно может служить практическим. Хранилище данных - это набор данных, объединяющий наборы данных по всей организации.

Datamart будет содержать наборы данных, характерные для определенных частей бизнеса. В информационном магазине вы найдете таблицы фактов, измеримые фрагменты информации, а также измерения, атрибуты ваших измеримых фрагментов.

Истинное хранилище данных будет иметь согласованные таблицы измерений, которые могут быть общими для всех информационных сетей.

Пример ...

Ваша компания может построить datamart вокруг продаж. И еще один datamart вокруг человеческих ресурсов. Если таблица измерений клиента является общей для обеих этих информационных таблиц, она считается согласованным измерением. Все три этих объекта вместе составляют хранилище данных.

Как сказал кто-то другой, более подробную информацию можно найти, выполнив поиск по Стратегиям данных Ральфа Кимбалла.

...