Я выбираю подходящие инструменты для BI / OLAP, и мне нужно понять, подходит ли Snowflake или Druid для моих целей.
В настоящее время я использую Snowflake в качестве хранилища данных, и он служит обоим
- запросов необработанных данных (с массивными ответами набора данных)
- агрегированных результатов
Для достижения производительности второго типа я создаю дополнительное агрегированиетаблицы, которая действует как куб OLAP.Мои данные основаны на времени.
Однако этот метод требует дополнительной работы, а также требований к дублированию данных и статическим запросам.
Поэтому я подумываю принять Apache Druid, который будетобеспечить решение для агрегации.
Способен ли Druid заменить Snowflake для набора необработанных данных, предполагая, что запросы всегда будут ограничены временным диапазоном, и что я могу использовать scan-запросы?Или я должен хранить обе БД?