Process-Exporter с правилами оповещения в Prometheus, когда процесс использует слишком много CPU - PullRequest
0 голосов
/ 08 ноября 2019

Я использую процесс-экспортер для мониторинга процесса, а затем оповещаю, когда процесс использует слишком много ЦП.

Это код моего монитора ЦП на панели инструментов Prometheus

sum(rate(namedprocess_namegroup_cpu_seconds_total{groupname=~"$processes",instance="$host", mode=~"system|user"}[20s])) by (groupname, instance)

Я пробовалнаписать предупреждение с помощью этого (сначала проверьте 10% CPU)

- name: process
  rules:
  - alert: CPUProcess
    expr: sum(rate(namedprocess_namegroup_cpu_seconds_total[20s])) by (groupname, instance) > 10
    for: 1m
    labels:
      severity: critical
    annotations:
      summary: "(instance {{ $labels.instance }}) use too much CPU"
      description: "Process (instance {{ $labels.groupname }}) use high CPU"

Но похоже, что оно не работает (другое оповещение может работать нормально), вы можете дать мне совет, спасибо.

1 Ответ

0 голосов
/ 12 ноября 2019

исправлено изменено на namedprocess_namegroup_cpu_seconds_total{groupname=~".+", mode=~"system"} > 10

...