В настоящее время у меня есть предупреждение Prometheus, которое срабатывает, когда мой показатель успеха падает ниже 85%.
Я хотел бы добавить абсолютные числа отношения к описанию предупреждения.Как мне это сделать?
Мой YAML в настоящее время выглядит следующим образом (я убрал некоторые посторонние детали):
groups:
- name: recording_rules
rules:
- record: number_of_successes_24h
expr: avg(sum by(instance)(my_status{kubernetes_name="my-prom",timeRange="1d",status=~"success"}))
- record: number_of_total_24h
expr: avg(sum by(instance)(my_status{kubernetes_name="my-prom",timeRange="1d"}))
- record: success_rate_24h
expr: clamp_max(number_of_successes_24h / number_of_total_24h * 100, 100)
- name: alerting_rules
rules:
- alert: LowSuccessRate24H
expr: success_rate_24h < 85
labels:
severity: critical
annotations:
summary: "CRITICAL: Low success rate 24h"
description: "Success rate in the last 24 hours went below 85% (value: {{ $value }}%)"
У меня вопрос, как мне добавить number_of_successes_24h
и number_of_total_24h
в описание?
Я прочитал официальную документацию по https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/,, но заблудился;Я искал SO, но не нашел ничего релевантного.
Я прочитал, что в $labels
доступны дополнительные подробности, поэтому я попытался распечатать его в качестве примера, чтобы увидеть, что в нем, но я получилmap[__name__:success_rate_24h]
, и я не мог понять, как это увидеть внутри.
Приветствуются частичные ответы и руководства.Спасибо.