Как я могу предупредить, что в Datadog происходит сбой определенного процесса? - PullRequest
0 голосов
/ 20 ноября 2018

Я пытаюсь выяснить, как создать оповещение вокруг процесса, который может несколько раз завершаться сбоем и перезапускаться. Возможно, он предоставляет некоторые данные Datadog, пока он активен, поэтому предупреждение «нет данных» не сработает, потому что отсутствие данных никогда не достигает порогового значения длительности при перезапуске процесса. Я думал о предупреждении об изменении PID, но я не могу понять, как создать монитор на основе PID. Является ли это возможным? И как? У кого-нибудь есть еще предложения по этой ситуации?

1 Ответ

0 голосов
/ 20 ноября 2018

Возможно, вы могли бы изменить проверку процесса, чтобы также пометить метрику номера процесса с помощью PID ( это, вероятно, где вы бы изменили это ).Таким образом, вы можете сгруппировать свой монитор по тегу pid, и оповещения об отсутствии данных сообщат вам, когда переключился pid.

Но это также предупредит об ожидаемых изменениях pid, поэтому, возможно, вам придется слишком настойчиво планировать время простоя, чтобы это было хорошей идеей?

Может быть, отслеживание некоторых журналов сбоев с помощью их инструмент управления журналами был бы лучшим подходом?

...