Я использую Pushgateway для записи данных из различных пакетных заданий, которые я хотел бы отобразить в виде отдельных линий на графике в Grafana.
Каждое задание имеет группировку internal_job_id
, которая отслеживает, какое пакетное задание измеряет заданная метрика, а также группировку status
для отслеживания успехов и неудач. Существует также поле «instance_id», которое устанавливается уникально при каждом запуске задания.
Я пытался использовать sum_over_time(push_time_seconds{status="failed"}[15m])
, а также метод, описанный здесь (https://www.robustperception.io/aggregating-across-batch-job-runs-with-push_time_seconds), но ни один из них не привел к графику, содержащему строки для количества сбоев в данном 15-минутном блоке, как требуется.
Что я делаю не так? Помощь очень ценится.