expr в шаблоне jinja для генерации действительного числа предупреждений в prometheus - PullRequest
0 голосов
/ 09 июня 2019

Необходимо написать expr в alertrule.yaml.j2, чтобы оповещения генерировались при сбоях более чем на 50% в заданном диапазоне времени (10 минут), где ошибка измеряется метрикой: metric_Failures {name = "\" EndpointA \ ""} общее количество запросов, измеренных метрикой: metric_total {name = "\" EndpointA \ ""}

alertrule.yaml.j2:

- name: prometheusAlertRules
  rules:
  - alert: failure_alert
    expr: "round(metric_Failures{ name=\"{{"}}EndpointA{{"}}\" {{ '}' }} [10m] / metric_total{ name=\"{{"}}EndpointA{{"}}\" {{ '}' }} [10m])  > 0.50"
    for: 3m
    labels:
      service: '{{ '{{' }} $labels.application {{ '}}' }}'
      severity: critical
      value: '{{ '{{' }} $value {{ '}}' }}'


Не генерирует ожидаемое количество предупреждений! Не уверен, что ошибка в expr, поскольку новичок в этом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...