Что такое хранилище данных? - PullRequest
22 голосов
/ 23 июня 2010

Клиент спросил меня, что на самом деле означает термин "хранилище данных".

Я думал об ETL, деталях модели данных, отличиях от NoSQL, Clouds, «нормальной» СУБД, MDM (Master Data Management) и т. Д., Но не смог описать этот термин в нескольких словах для него… (На самом деле я немного поговорил и оставил его неосвещенным.)

Как может «хранилище данных» описываться в 1-3 (или чуть более) предложениях?

Ответы [ 11 ]

18 голосов
/ 23 июня 2010

Для нетехнических парней лучше всего описать это как "Огромное количество данных, хранящихся в специализированной компьютерной системе. Данные обычно связаны с какой-то конкретной областью, и вся система разработана так, чтобы быть быстрой и оптимизированной для некоторыхзадачи. Данные, хранящиеся в хранилищах данных, в основном используются для анализа или принятия решений. "

Не уверен, что этого достаточно :) В Интернете много ссылок на эту тему, но есликто-то попросил у меня быстрого определения, я бы использовал что-то похожее на то, что я написал выше.

6 голосов
/ 23 июня 2010

С вики :

Хранилище данных является хранилищем организация хранится в электронном виде данные, предназначенные для облегчения отчетности и анализ 1 .

Это определение хранилища данных фокусируется на хранении данных. Тем не менее средства для извлечения и анализа данных, чтобы извлекать, преобразовывать и загружать данные, и управлять словарем данных также считаются важными компонентами система хранения данных. Много ссылки на использование хранилищ данных этот более широкий контекст. Таким образом, расширенное определение для данных складирование включает в себя бизнес интеллектуальные инструменты, инструменты для извлечения, преобразовать и загрузить данные в хранилище и инструменты для управления и получить метаданные.

5 голосов
/ 23 июня 2010

По крайней мере, теоретически идея хранилища данных состоит в том, чтобы предоставить консолидированное представление данных из множества существующих систем, которые, как правило, считаются нецелесообразными для перезаписи для консолидации данных напрямую.Поэтому хранилище данных собирает данные из этих существующих систем и предоставляет (по крайней мере, иллюзию) все данные, находящиеся в одном месте, поэтому их можно запрашивать одним способом.

Основной целью является (обычно) разрешить корреляцию между данными из существующих систем.Например, вы можете сравнить, сколько времени ваш продавец провел с клиентом X (который хранится в одной системе) с тем, сколько покупатель X купил (хранится во второй системе) и насколько клиент X доволен тем, что он получает (хранит,конечно, в третьей системе).

С практической точки зрения это часто означает, что идеи клиента находятся где-то между плохо определенными и совершенно безумными.О стоимости и графике почти невозможно даже догадываться, а точная оценка явно невозможна.Реализация того, что он действительно хочет, почти наверняка невозможна, а для того, чтобы найти что-то полезное, потребуется достаточно времени и работы, что ваш первый шаг - сделать то, что вы делаете, достаточно техническим, чтобы у него не было сердца.нападать, когда он получает представление о стоимости и / или графике.

4 голосов
/ 02 мая 2013

Ух ты, я занимался исследованиями. Это действительно хороший ответ, с которым я столкнулся:

Хранилище данных ... это воспроизводимая версия транзакций данных, которые специально структурированы и созданы для запроса, анализа и отчетности. В очень простом определении термин «хранилище данных» относится к процессу систематического сбора данных, которые хранятся организованным образом, чтобы к ним можно было обращаться и получать их для будущих отчетов и анализа документов

Это из " Хранилища данных 100 секретов успеха " Ричарда Мартина

4 голосов
/ 23 июня 2010

Хранилище данных - это попытка сделать разрозненные системы однородными независимо от базовой технологии или механизма хранения.

Вы можете понять, почему хранилище данных, но это другой вопрос.

3 голосов
/ 23 июня 2010

ПОЦЕЛУЙ ...

Хранилище данных - это хранилище данных, относящихся к данной организации и ее деятельности. Эти данные позволят анализировать и сообщать о результатах деятельности организации по различным аспектам, таким как время, структура, потоки деятельности. Эти измерения можно объединять, а результаты агрегировать по соответствующим иерархиям.

3 голосов
/ 23 июня 2010

Хранилище данных - это база данных, система загрузки данных и система отчетности, предназначенная для агрегирования данных из нескольких источников и представления их в форме, которую легко извлечь и отчитаться.С практической точки зрения, преимущества успешного проекта хранилища данных:

  • Статистическая и финансовая отчетность - хранилища данных облегчают работу с данными в совокупности и получают полезный анализ из них,особенно если у вас есть 65537 или более строк данных.

  • Безопасность данных - данные хорошо себя ведут и не имеют ловушек для молодых игроков.Специальные системы отчетности могут использоваться неопытными пользователями с низким риском получения неверных результатов в отчетах без предварительного уведомления.

  • Прозрачность - предприятие может видеть и выявлять проблемы с данными восновные системы.Хранилище данных может быть хорошим инструментом для обеспечения качества данных.

  • Расширение прав и возможностей - инструменты отчетности конечного пользователя должны поддерживать большинство требований к управленческой информации с минимальным набором, требующим специального отчетаразрабатывается техническим специалистом.

1 голос
/ 19 января 2016

Хранилище данных - это реляционная база данных, предназначенная для анализа запросов и бизнеса, а не для обработки транзакций. Она содержит исторические данные, полученные из данных транзакций.Эти исторические данные используются бизнес-аналитиками для подробного понимания бизнеса.

Хранилище данных должно иметь следующие характеристики:

  1. Субъектно-ориентированный:

Хранилище данных помогает в анализе данных.Например, чтобы узнать о продажах компании, хранилище данных должно основываться на данных о продажах.Используя это хранилище данных, мы можем найти продажи за прошлый год.Эта способность определять хранилище данных по предмету (продажам) делает его предметно-ориентированным.

Интегрировано:

Сбор данных из разных источников и приведение их в единый формат.Это включает в себя разрешение единиц измерения, конфликты имен и т. Д.

Энергонезависимый:

Как только данные поступают в хранилище данных, данные не должны обновляться.

Вариант времени:

Для анализа бизнеса аналитикам нужны большие объемы данных.Итак, хранилище данных должно содержать исторические данные.

1 голос
/ 23 июня 2010

С практической точки зрения: меняется бизнес, меняется среда, что было важным вопросом вчера, может не быть сегодня и, скорее всего, не будет завтра. Это особенно верно при работе с вопросами на уровне генерального директора.

Если вы не можете предугадать, какими будут вопросы, ваш единственный вариант - предоставить средства для быстрого ответа на любой вопрос. Это то, что хранилища данных пытаются или намерены сделать. Откуда поступают данные и из скольких разнородных систем, не имеет значения.

Многие хранилища данных терпят неудачу в «быстром ответе на любой вопрос», потому что их технология требует, чтобы вы вывернули доступные необработанные данные «наизнанку» (делая кубы), чтобы обеспечить «быстро». И определение этих кубов ограничивает разнообразие вопросов, на которые можно ответить.

0 голосов
/ 07 января 2013

Из того, что я знаю, хранилище данных - это не что иное, как реляционная база данных, предназначенная для запросов и анализа.Обычно он содержит исторические данные, полученные из данных транзакций.

Согласно Уильяму Инмону, определение хранилища данных:

хранилище данных - это предметно-ориентированный, интегрированный, энергонезависимый и изменяющийся во времени сбор данныхв поддержку решений руководства.

И приведенное выше определение является логичным и совершенным, если мы мыслим рационально и его можно понять из здесь

...