Использование AlertManager для оповещения о сбое Ping удаленных модулей - PullRequest
1 голос
/ 12 июня 2019

В Prometheus с использованием AlertManager я пытаюсь написать предупреждение для пользовательской метрики, в которой хранится метка времени для последнего пинга узла в кластере.Если вы посмотрите на это на графике без фильтров, он линейно масштабируется вверх.

Я пытался использовать другие функции, такие как rate (), changes (), resets (), с ограниченными результатами.

Я придумал что-то похожее на приведенное ниже с ограниченными результатами:delta(ping_timestamp[5m]) < 20

Моя цель - найти 5-минутные промежутки в ответе, прежде чем я оповестю об этом.Хотя мне было интересно, может ли быть лучшее решение.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...