Мониторинг Kubernetes с Grafana: много недостающих данных в последней версии Prometheus - PullRequest
0 голосов
/ 04 июля 2018

У меня есть работающий кластер Kubernetes, который я хочу отслеживать с помощью Grafana.

Я пробовал много панелей из https://grafana.com/dashboards, но все они, похоже, имеют некоторые проблемы: похоже, что есть несоответствие между именами метрики Прометея и тем, что ожидает панель.

Например, если я посмотрю на недавно выпущенную, довольно популярную панель инструментов: https://grafana.com/dashboards/5309/revisions

Я получаю много «дырок» при запуске:

grafana dashboard with missing values

Глядя на конфигурацию панели, я вижу, что проблемы возникают из-за небольших изменений клавиш, например node_memory_Buffers вместо node_memory_Buffers_bytes.

Аналогично, приборная панель ожидает node_disk_bytes_written, когда Прометей предоставляет node_disk_written_bytes_total.

Я опробовал лот панелей, специфичных для Kubernetes, и у меня та же проблема почти со всеми из них.

Я что-то не так делаю?

1 Ответ

0 голосов
/ 04 июля 2018

Экспортер узлов Prometheus изменил много имен метрик в версии 0.16.0, чтобы соответствовать новым соглашениям об именах.

С https://github.com/prometheus/node_exporter/releases/tag/v0.16.0:

Срочные изменения

Этот выпуск содержит серьезные изменения в именах метрик. Много метрики имеют новые имена, метки и значения меток для соответствия к действующим соглашениям об именах.

  • Метрики Linux node_cpu теперь разбивают guest значения на отдельные метрики.
  • Многие метрики счетчиков были переименованы в include _total.
  • Многие метрики были переименованы / изменены, чтобы включить базовые единицы, например node_cpu сейчас node_cpu_seconds_total.

См. Также руководство по обновлению . Одним из предложений является использование правил совместимости , которые будут создавать дубликаты метрик со старыми именами.

В противном случае используйте версию 0.15.x, пока панели инструментов не будут обновлены, или исправьте их!

...