Мне нужно применить несколько предупреждений, используя правила Прометея, чтобы узнать, какие модули были перезапущены, а какие - прекращены. Я нашел некоторые правила, специфицирующие c для перезапуска и завершения модулей, но у меня были некоторые пояснения относительно этого.
Например:
Пример группы с одним предупреждением
groups:
- name: example-alert
rules:
# Alert about restarts
- alert: RestartAlerts
expr: count(kube_pod_container_status_restarts_total) by (pod-name) > 5
for: 10m
annotations:
summary: "More than 5 restarts in pod {{ $labels.pod-name }}"
description: "{{ $labels.container-name }} restarted (current value: {{ $value }}s) times in pod {{ $labels.pod-namespace }}/{{ $labels.pod-name }}"
так, в этом случае, как мы знаем, что pod-name, container-name. оба из них могут обновляться для каждого нового развертывания, для этого примера, как это будет работать ??