Какую БД использовать для сравнения курсов данных по дням? - PullRequest
2 голосов
/ 11 января 2020

В настоящее время я думаю о небольшом проекте «BigData», в котором я хочу записывать некоторые использования каждые 10 минут и записывать их в БД в течение нескольких месяцев или лет. Затем я хочу проанализировать данные, например, следующим образом:

  • Какое время суток лучше (с точки зрения низкой загрузки)?
  • Каковы различия в использовании между обычные будни и дни выходных?
  • В какое время начинается более высокая часть использования в обычный понедельник?

Для этого мне, очевидно, нужна возможность строить усредненные графики например, для всех понедельников, которые были записаны до сих пор.

Для первого «доказательства концепции» я настроил InfluxDB и Grafana, которые прекрасно работают для просмотра данных, записываемых в БД, но чем больше я исследую на inte rnet тем более я вижу, что InfluxDB не создан для того, что я хочу сделать (или он пока не может этого сделать).

Так что, какую базу данных лучше всего записать и проанализировать данные подобным образом? ? Или это больше похоже на вопрос о том, какой инструмент использовать для анализа данных? Какой это может быть инструмент?

1 Ответ

2 голосов
/ 13 января 2020

Язык запросов InfluxDB недостаточно гибок для ваших вопросов. SQL базы данных, поддерживаемые Grafana (MySQL, Postgres, TimescaleDB, Clickhouse), похоже, лучше подходят. Выбор зависит от ваших предпочтений и объема ваших данных. Для небольших наборов данных может быть достаточно чистых MySQL & Postgres. Для более высоких нагрузок рассмотрите TimescaleDB. Для миллиардов точек данных Clickhouse, вероятно, лучше.

Если вы хотите легкое, но масштабируемое решение для временных рядов No SQL, взгляните на VictoriaMetrics .

...