Как получить уведомление или предупреждение об ошибке конфигуратора в Prometheus? - PullRequest
2 голосов
/ 09 апреля 2019

Я использую оператор prometheus для развертывания стека мониторинга на kubernetes. Я хотел бы знать, если есть способ знать, если конфигурации, развернутой перегрузчиком конфигурации не удалось. Это полезно для ресурсов Prometheus и Manager, которые используют контейнер перезагружателя конфигурации для перезагрузки своих настроек. Когда конфиг не удалось. У нас есть журнал в контейнере, но можем ли мы получить уведомление или предупреждение, основанное на неудачной перезагрузке конфигурации?

1 Ответ

3 голосов
/ 09 апреля 2019

Прометей выставляет / метрическую конечную точку, которую вы можете очистить. В частности, существует метрика, показывающая, была ли успешной последняя перезагрузка:

# HELP prometheus_config_last_reload_successful Whether the last configuration reload attempt was successful.
# TYPE prometheus_config_last_reload_successful gauge
prometheus_config_last_reload_successful 0

Вы можете использовать его для оповещения о неудачной перезагрузке.

groups:
- name: PrometheusAlerts
  rules:
  - alert: FailedReload
    expr: prometheus_config_last_reload_successful == 0
    for: 5m
    labels:
      severity: warning
    annotations:
      description: Reloading Prometheus' configuration has failed for {{$labels.namespace}}/{{ $labels.pod}}.
      summary: Prometheus configuration reload has failed
...