Я использую процесс-экспортер для мониторинга процесса, а затем оповещаю, когда процесс использует слишком много ЦП.
Это код моего монитора ЦП на панели инструментов Prometheus
sum(rate(namedprocess_namegroup_cpu_seconds_total{groupname=~"$processes",instance="$host", mode=~"system|user"}[20s])) by (groupname, instance)
Я пробовалнаписать предупреждение с помощью этого (сначала проверьте 10% CPU)
- name: process
rules:
- alert: CPUProcess
expr: sum(rate(namedprocess_namegroup_cpu_seconds_total[20s])) by (groupname, instance) > 10
for: 1m
labels:
severity: critical
annotations:
summary: "(instance {{ $labels.instance }}) use too much CPU"
description: "Process (instance {{ $labels.groupname }}) use high CPU"
Но похоже, что оно не работает (другое оповещение может работать нормально), вы можете дать мне совет, спасибо.