Апач Друид против Снежинки - PullRequest
0 голосов
/ 29 апреля 2019

Я выбираю подходящие инструменты для BI / OLAP, и мне нужно понять, подходит ли Snowflake или Druid для моих целей.

В настоящее время я использую Snowflake в качестве хранилища данных, и он служит обоим

  1. запросов необработанных данных (с массивными ответами набора данных)
  2. агрегированных результатов

Для достижения производительности второго типа я создаю дополнительное агрегированиетаблицы, которая действует как куб OLAP.Мои данные основаны на времени.

Однако этот метод требует дополнительной работы, а также требований к дублированию данных и статическим запросам.

Поэтому я подумываю принять Apache Druid, который будетобеспечить решение для агрегации.

Способен ли Druid заменить Snowflake для набора необработанных данных, предполагая, что запросы всегда будут ограничены временным диапазоном, и что я могу использовать scan-запросы?Или я должен хранить обе БД?

Ответы [ 2 ]

0 голосов
/ 27 мая 2019

Я работаю над Snowflake с прошлого года, и это один из лучших S / W.

Вы не получаете требуемой производительности на Снежинке?Я надеюсь, что вы используете кластер большого размера.Если нет, попробуйте использовать Large и посмотрите производительность.

0 голосов
/ 27 мая 2019

Я не знаю много о снежинке, но думаю, что Друид может охватить те функции, которые вы упомянули (1) и (2).Моя команда разрабатывает Metatron Discovery (https://metatron.app) на основе Druid, настроенного для нашей цели BI. Вы можете проверить производительность Druid в BI с помощью графического интерфейса у нас. Проверьте также наше репозиторий github: https://github.com/metatron-app/metatron-discovery Я надеюсьэто поможет вам немного узнать больше о движке Druid.

...