Прометей запускает оповещение, но оповещение разрешается автоматически через 10 м, даже если оповещение все еще срабатывает.Есть идеи, почему оповещение было разрешено, когда оно должно было продолжаться?Как Resolution_timeout работает с group_interval?
В AlertManager определены следующие интервалы:
group_wait: 30s
group_interval: 10m
repeat_interval: 1h
Правило Прометея:
- alert: PodsDown
expr: sum(kube_pod_container_status_running{pod=~"sql.*"}) < 2
for: 5m
labels:
severity: Sev1
annotations:
description: SQL is down