Какая архитектура для проекта с большими данными? - PullRequest
0 голосов
/ 09 ноября 2019

Это звучит как очень общий вопрос, на который я ожидаю ответов «да, но».

Ожидая, что в следующем году поступят 100-гигабайтные диверсифицированные данные, я хочу построить стабильную структуру. Эти данные будут периодически (один раз в месяц) использоваться для статического анализа, но у нас также будут инструментальные панели с запросами @ 5 секунд, за которыми следует некоторая аналитика.

Моя идея заключается в следующем: (1) настроить кассандруBD на кластере ubuntu vm (2) связывает кассандру с эластичным поиском, чтобы обеспечить быстрые показания (3) добавить искру на вершине, чтобы разрешить распределенный анализ (4) Контролировать все, используя панель управления кибана или графана.

IИнтересно, относится ли этот вопрос к SO, учитывая, что это не чисто вопрос кодирования. Если это не так, я заранее извиняюсь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...