У меня есть некоторые метрики, подобные этой:
restarts{service="foo-1"}
restarts{service="foo-2"}
restarts{service="bar-1"}
restarts{service="bar-2"}
restarts{service="bar-3"}
Я пытаюсь использовать Alertmanager для запуска оповещения, когда число перезапусков всех экземпляров службы превышает пороговое значение.
Мне приходит в голову создать правило для каждого foo
и bar
отдельно, используя такой запрос:
sum(restarts{service=~"bar-.*"}) > 10
Но моих служб слишком много, чтобы написать правило для каждый из них.
Можно ли найти перезапуск каждой службы в одном запросе?