В чем разница между базой данных и хранилищем данных? - PullRequest
153 голосов
/ 06 августа 2010

В чем разница между базой данных и хранилищем данных?

Разве это не одно и то же или, по крайней мере, написано в одном и том же (то есть Oracle RDBMS)?

Ответы [ 13 ]

137 голосов
/ 06 августа 2010

Проверьте это для получения дополнительной информации.

По предыдущей ссылке:

База данных

  1. Используетсядля оперативной обработки транзакций ( OLTP ), но может использоваться для других целей, таких как хранилище данных.Это записывает данные пользователя для истории.
  2. Таблицы и объединения являются сложными, поскольку они нормализованы (для RDMS ).Это делается для уменьшения избыточных данных и экономии места для хранения.
  3. Entity - для проектирования базы данных RDMS используются методы реляционного моделирования.
  4. Оптимизировано для операции записи.
  5. Производительность равнанизкий для анализа запросов.

Хранилище данных

  1. Используется для оперативной аналитической обработки ( OLAP ).Это читает исторические данные для пользователей для бизнес-решений.
  2. Таблицы и объединения просты, поскольку они не нормализованы.Это сделано для уменьшения времени отклика на аналитические запросы.
  3. Данные. Для проектирования хранилища данных используются методы моделирования.
  4. Оптимизировано для операций чтения.
  5. Высокая производительность для аналитических запросов.
  6. Является обычно База данных.

Также важно отметить, что хранилища данных могут быть полученыот нуля до многих баз данных.

28 голосов
/ 03 сентября 2010

с нетехнической точки зрения: База данных ограничена определенными приложениями или набором приложений.

Хранилище данных - это хранилище данных уровня предприятия. Он будет содержать данные из всех / многих сегментов бизнеса. Он собирается поделиться этой информацией, чтобы обеспечить глобальную картину бизнеса. Это также важно для интеграции между различными сегментами бизнеса.

С технической точки зрения: Слово «Хранилище данных» не имеет признанного определения. Лично я определяю хранилище данных как набор витрин данных. Где каждый витрина данных состоит из одной или нескольких баз данных, где база данных специфична для определенного набора проблем (приложения, набора данных или процесса).

Проще говоря, база данных является компонентом хранилища данных. Есть много мест, где можно исследовать эту концепцию, но поскольку нет «определения», вы найдете проблемы с любым ответом, который вы дадите.

14 голосов
/ 06 августа 2010

Хранилище данных - это ТИП базы данных.

В дополнение к тому, что люди уже сказали, хранилища данных, как правило, являются OLAP, с индексами и т. Д., Настроенными для чтения, а не записи, и данные нормализуются / преобразуются в формы, которые легче читать и анализировать.

Некоторые люди говорят, что «базы данных» такие же, как OLTP - это не так. OLTP, опять же, это ТИП базы данных.

Другие типы «баз данных»: текстовые файлы, XML, Excel, CSV ..., плоские файлы: -)

6 голосов
/ 06 августа 2010

Самый простой способ объяснить это - сказать, что хранилище данных состоит не только из базы данных. База данных - это набор данных, организованных каким-либо образом, но хранилище данных организовано специально для «облегчения отчетности и анализа». Это, однако, не вся история, поскольку хранилище данных также содержит «средства для извлечения и анализа данных, для извлечения, преобразования и загрузки данных, а также для управления словарем данных также считаются важными компонентами системы хранилища данных».

Хранилище данных

2 голосов
/ 15 мая 2018

Хранилище данных по сравнению с базой данных: Хранилище данных специально разработано для анализа данных, которое включает чтение больших объемов данных для понимания взаимосвязей и тенденций в данных. База данных используется для сбора и хранения данных, таких как запись деталей транзакции.

Хранилище данных: Подходящие рабочие нагрузки - аналитика, отчетность, большие данные. Источник данных - Данные, собранные и нормализованные из многих источников. Сбор данных - Операции с массовой записью, как правило, по заранее заданному расписанию партии. Нормализация данных - Денормализованные схемы, такие как схема «Звезда» или «Снежинка». Хранение данных - Оптимизировано для простоты доступа и высокоскоростного запроса. производительность с использованием столбчатого хранилища. Доступ к данным - Оптимизирован для минимизации ввода-вывода и максимизации пропускной способности данных.

Транзакционная база данных: Подходящие рабочие нагрузки - обработка транзакций. Источник данных - Данные, полученные как есть, из одного источника, такого как транзакционная система. Сбор данных - Оптимизирован для непрерывных операций записи, поскольку новые данные доступны для максимизации пропускной способности транзакций. Нормализация данных - Сильно нормализованные статические схемы. Хранение данных - Оптимизировано для больших операций записи в единый физически ориентированный блок. Доступ к данным - Большие объемы небольших операций чтения.

2 голосов
/ 31 августа 2017

База данных : - OLTP (процесс онлайн-транзакций)

  • Это текущие данные, последние подробные данные, плоские реляционные изолированные данные.
  • Отношения сущностей используются для проектирования базы данных
  • Размер БД 100 МБ-ГБ простая транзакция или запросы

Datawarehouse

  • OLAP(Аналитический онлайн-процесс)
  • Речь идет об исторических данных. Схема «Звезда», схема сгиба по снегу и галактика * Схема 1020 *
  • используется для проектирования хранилища данных
  • Размер БД 100 ГБ-ТБоснова производительности запросов для минимизации данных Визуализация данных
  • Позволяет пользователям получить более глубокое понимание и знание различных аспектов своих корпоративных данных благодаря быстрому и согласованному интерактивному доступу к широкому спектру возможных представлений данных
1 голос
/ 30 апреля 2018

Любое хранилище данных для приложения обычно использует базу данных.Это может быть реляционная база данных или нет базы данных sql, которые в настоящее время находятся в тренде.

Хранилище данных также является базой данных.Мы можем назвать базу данных хранилища данных как специализированное хранилище данных для целей аналитической отчетности для компании.Эти данные используются для ключевых бизнес-решений.

Упорядоченные данные помогают эффективно составлять отчеты и принимать деловые решения.

0 голосов
/ 18 мая 2019

Хранилище данных - это тип структуры данных, обычно размещаемой в базе данных. Хранилище данных ссылается на модель данных и тип данных, которые там хранятся - данные, которые моделируются (модель данных), для аналитических целей сервера.

База данных может быть классифицирована как любая структура, которая содержит данные. Традиционно это будет СУБД, такая как Oracle, SQL Server или MySQL. Однако база данных также может быть базой данных NoSQL, такой как Apache Cassandra, или столбчатой ​​MPP, такой как AWS RedShift.

Вы видите, что база данных - это просто место для хранения данных; Хранилище данных - это особый способ хранения данных, который служит определенной цели, которая заключается в обслуживании аналитических запросов.

OLTP против OLAP не говорит о разнице между DW и базой данных, и OLTP и OLAP находятся в базах данных. Они просто хранят данные по-разному (разные методологии модели данных) и служат разным целям (OLTP - транзакции записи, оптимизированные для обновлений; OLAP - анализ информации, оптимизированные для чтения).

0 голосов
/ 15 января 2019

Источником для хранилища данных может быть кластер баз данных, поскольку базы данных используются для процесса онлайн-транзакций, например, для хранения текущих записей ... но в хранилище данных хранятся исторические данные, предназначенные для аналитического процесса в Интернете.

0 голосов
/ 22 мая 2018

База данных:

Используется для оперативной обработки транзакций (OLTP).

  • Ориентированная на транзакции.
  • Ориентирован на приложение.
  • Текущие данные.
  • Подробные данные.
  • Масштабируемые данные.
  • Многие пользователи, администраторы / операционные.
  • Время выполнения: короткое.

Хранилище данных:

Используется для оперативной аналитической обработки (OLAP).

  • Ориентированный анализ.
  • Предметно-ориентированный.
  • Исторические данные.
  • Агрегированные данные.
  • Статические данные.
  • Не так много пользователей, менеджер.
  • Время выполнения: долго.
...