Я пытаюсь получить уведомление о остановленных контейнерах с помощью следующего предупреждения:
alert: artifactory_down
expr: absent(container_memory_usage_bytes{name="artifactory"})
for: 1m
labels:
severity: critical
annotations:
description: Artifactory container is down for more than 60 seconds.
summary: Artifactory down
К сожалению, во временных рядах есть пробелы, которые приводят к ошибочным оповещениям. Контейнер все еще работает. Пробелы составляют от 1 до 5 минут.
Есть идеи, что может вызвать это или как еще проанализировать это?