Datamart и отчет Cube, в чем различия? - PullRequest
17 голосов
/ 12 декабря 2008

Термины используются повсеместно, и я не знаю четких определений. Я почти уверен, что знаю, что такое витрина данных. И я создал отчетные кубы с помощью таких инструментов, как Business Objects и Cognos.

У меня также есть люди, которые говорят мне, что datamart - это больше, чем просто набор кубов.

Мне также говорили, что datamart - это куб отчетов, не более того.

Какие различия вы понимаете?

Ответы [ 8 ]

28 голосов
/ 12 декабря 2008

Куб может (и, возможно, должен) означать что-то весьма специфическое - артефакты OLAP, представленные через сервер OLAP , такие как MS Analysis Services или Oracle (ранее Hyperion) ) Essbase . Тем не менее, он также используется гораздо более свободно. В кубах OLAP этого типа используются инструменты запросов с поддержкой кубов, которые используют API, отличный от стандартной реляционной базы данных. Обычно серверы OLAP поддерживают свои собственные оптимизированные структуры данных (известные как MOLAP ), хотя они могут быть реализованы в качестве внешнего интерфейса к реляционному источнику данных (известный как ROLAP ) или в различных гибридные режимы (известные как HOLAP )

Я пытаюсь быть конкретным и специально использую «куб» для ссылки на кубы на серверах OLAP, таких как SSAS.

Business Objects работает путем запроса данных через один или несколько источников (которые могут быть реляционными базами данных, кубами OLAP или плоскими файлами) и создания структуры данных в памяти, называемой MicroCube который он использует для поддержки интерактивных срезов. Службы Analysis Services и MSQuery могут создать файл cube (.cub) , который можно открыть клиентским программным обеспечением AS или Excel и нарезать кубиками аналогичным образом. IIRC Последние версии Business Objects также могут открывать файлы .cub.

Чтобы быть педантичным, я думаю, что Business Objects находится в «полуструктурированном» пространстве отчетов где-то между настоящей системой OLAP, такой как ProClarity, и специальным инструментом отчетности, таким как Построитель отчетов , Oracle Первооткрыватель или Brio . Круглые обходы панели запросов делают ее несколько неуклюжей, как простой инструмент OLAP, но она предлагает уровень интерактивности, которого нет в традиционных отчетах. Я вижу приятное место Business Objects в двух местах: специальные отчеты сотрудников, не обязательно знакомых с SQL, и предоставление запланированного отчета, предоставляемого в интерактивном формате, который позволяет провести некоторые детализации данных.

'Data Mart' также является довольно свободно используемым термином и может означать любой пользовательский носитель доступа к данным для системы хранилища данных. Определение может включать или не включать инструменты отчетности и слои метаданных, таблицы уровней отчетности или другие элементы, такие как кубы или другие аналитические системы.

Я склонен думать о витрине данных как о базе данных, из которой составляются отчеты, особенно если это легко определяемая подсистема всей архитектуры хранилища данных. Однако вполне разумно думать о нем как об уровне отчетности, ориентированном на пользователя, особенно если существуют специальные инструменты отчетности, такие как Business Objects или системы OLAP, которые позволяют конечным пользователям получать данные напрямую.

9 голосов
/ 07 января 2009

Термин «витрина данных» стал несколько двусмысленным, но он традиционно связан с предметно-ориентированным подмножеством информационных систем организации. Витрина данных не подразумевает явного присутствия многомерной технологии, такой как OLAP, а витрина данных не подразумевает явного присутствия суммированных числовых данных.

С другой стороны, куб, как правило, подразумевает, что данные представляются с использованием многомерной номенклатуры (обычно это технология OLAP) и что данные обычно суммируются как пересечения множественных иерархий. (т. е. собственный капитал вашей семьи в сравнении с вашим личным имущественным состоянием и всем, что между ними) Обычно «куб» подразумевает нечто очень конкретное, тогда как «витрина данных» имеет тенденцию быть немного более общим.

Полагаю, в ООП можно сказать, что вы могли бы точно сказать, что киоск "имеет-есть", реляционная база данных "имеет-есть", отличный интерфейс для отчетов и т. Д. ... но было бы менее правильно сказать, что любой из этих индивидуально «есть» витрин данных. Термин витрина данных является более включительным.

4 голосов
/ 21 ноября 2012

Как следует из названия, куб представляет собой структурированный многомерный набор данных (обычно три измерения, каждое из которых представляет три стороны куба). Витрина данных - это просто контейнер, а не сама структура, хотя она содержит наборы данных, четко организованные (в виде таблиц) в измерениях и фактах.

Структура куба позволяет легко визуализировать или концептуализировать данные в различных измерениях куба. Таким образом, большинству бизнес-аналитиков или разработчиков легко запрашивать и взаимодействовать с кубом.

Поскольку витрина данных - это просто контейнер с кучей таблиц; Пользователи должны сначала осмыслить и понять размерные структуры, прежде чем запрашивать и анализировать данные.

3 голосов
/ 03 января 2014

Помните:

Хранилище данных - это процесс сбора данных из устаревших систем и баз данных транзакций и их преобразования в организованную информацию в удобном для пользователя формате, чтобы стимулировать анализ данных и поддерживать принятие деловых решений на основе фактов.

A Хранилище данных - это система, которая извлекает, очищает, соответствует и доставляет исходные данные в хранилище данных измерений, а затем поддерживает и реализует Запросы и анализ для принятия решений.

Кимбол, например последовательно определяет витрину данных как ориентированное на процесс подмножество данных всей организации, основанное на элементарных данных, и это зависит только от физики событий измерения данных, а не от ожидаемых вопросов пользователя.

  • Витрины данных основаны на источнике данных, а не на виде данных департамента.
  • Витрины данных содержат все атомарные детали, необходимые для поддержки детализации до самого низкого уровня.
  • Витрины данных могут управляться централизованно или децентрализовано.

ПРАВИЛЬНОЕ ОПРЕДЕЛЕНИЕ

  • Процесс основан
  • Атомная база данных
  • Измерение данных

НЕПРАВИЛЬНОЕ ОПРЕДЕЛЕНИЕ

  • на базе отдела
  • Только агрегированные данные
  • Пользовательский вопрос на основе
3 голосов
/ 30 сентября 2011

Data Mart представляет собой набор данных конкретного бизнес-процесса. Не имеет значения, как хранятся данные. Куб хранит данные особым образом, в нескольких измерениях, в отличие от таблицы со строками и столбцами. Куб в базе данных olap подобен таблице традиционной базы данных. У витрины данных могут быть таблицы или кубы. Кубы ускоряют анализ, поскольку он заранее рассчитывает агрегации.

3 голосов
/ 07 января 2009

Под витриной данных традиционно понимаются статические данные, обычно ориентированные на дату / время, которые используются аналитиками для составления статистики, составления бюджета, отчетности о производительности и продажах и других операций планирования.

Куб - это база данных OLAP, которая довольно полно преобразует данные OLTP в статическую схему, ориентированную на дату / время, которая использует язык запросов, не являющийся SQL, но созданный специально для ответов на вопросы типа витрины данных. Он использует такие термины, как меры, измерения, схема-звезда и т. Д., А не таблицы, столбцы и строки. Лучшей знакомой аналогией могут быть сводные таблицы в электронной таблице.

1 голос
/ 03 мая 2012

Я согласен с Мэтью. Мы склонны использовать термин «Data Mart» для любого источника данных, в котором хранятся общие данные и сопоставления, используемые в различных приложениях на предприятии. Мы не храним измеримые данные в витрине данных, поэтому я рассматриваю витрину данных как один из нескольких источников данных для куба. Однако именно так мы делаем это. Я уверен, что ничто не мешает вам хранить измеряемые данные в витрине данных.

1 голос
/ 12 декабря 2008

Для меня datamart - это просто место, куда данные сбрасываются в относительно плоский, непригодный для использования формат.

Куб берет эти данные и заставляет их танцевать.

...