У меня есть гистограмма запросов с путями и кодами состояния ... Как я могу предупредить, если количество ошибок увеличилось на 20% за последний час по сравнению с предыдущим часом?
один метрический образец:
{instance="someIp",instance_hostname="someHost",job="someAppName",le="+Inf",method="GET",path="somePath",status_code="500"}
Я должен полагаться на функцию оценки? что-то вроде:
rate(http_request_duration_seconds{job="someProject", status_code="500"}[60m])