Это звучит как очень общий вопрос, на который я ожидаю ответов «да, но».
Ожидая, что в следующем году поступят 100-гигабайтные диверсифицированные данные, я хочу построить стабильную структуру. Эти данные будут периодически (один раз в месяц) использоваться для статического анализа, но у нас также будут инструментальные панели с запросами @ 5 секунд, за которыми следует некоторая аналитика.
Моя идея заключается в следующем: (1) настроить кассандруBD на кластере ubuntu vm (2) связывает кассандру с эластичным поиском, чтобы обеспечить быстрые показания (3) добавить искру на вершине, чтобы разрешить распределенный анализ (4) Контролировать все, используя панель управления кибана или графана.
IИнтересно, относится ли этот вопрос к SO, учитывая, что это не чисто вопрос кодирования. Если это не так, я заранее извиняюсь.