Необходимо написать expr в alertrule.yaml.j2, чтобы оповещения генерировались при сбоях более чем на 50% в заданном диапазоне времени (10 минут), где
ошибка измеряется метрикой: metric_Failures {name = "\" EndpointA \ ""}
общее количество запросов, измеренных метрикой: metric_total {name = "\" EndpointA \ ""}
alertrule.yaml.j2:
- name: prometheusAlertRules
rules:
- alert: failure_alert
expr: "round(metric_Failures{ name=\"{{"}}EndpointA{{"}}\" {{ '}' }} [10m] / metric_total{ name=\"{{"}}EndpointA{{"}}\" {{ '}' }} [10m]) > 0.50"
for: 3m
labels:
service: '{{ '{{' }} $labels.application {{ '}}' }}'
severity: critical
value: '{{ '{{' }} $value {{ '}}' }}'
Не генерирует ожидаемое количество предупреждений!
Не уверен, что ошибка в expr, поскольку новичок в этом.