GCE оповещение, когда одна из созданных метрик отсутствует (через terraform) - PullRequest
0 голосов
/ 24 февраля 2020

Я настроил политики предупреждений через terraform, которые включали процессор / память и другие предупреждения (многие из них). К сожалению, я столкнулся с проблемой, когда один из моих экземпляров GCE перестал отвечать на запросы - я получаю много предупреждений в своем Slack, потому что я настроил блок condition_absent для всех моих политик.

Например:

    condition_absent {
      duration = "360s"
      filter   = "metric.type=\"custom.googleapis.com/quota/gce\" resource.type=\"global\""

      aggregations {
        alignment_period     = "60s"
        cross_series_reducer = "REDUCE_SUM"
        group_by_fields = [
          "metric.label.metric",
          "metric.label.region",
        ]
        per_series_aligner = "ALIGN_MEAN"
      }
    condition_absent {
      duration = "360s"
      filter          = "metric.type=\"agent.googleapis.com/memory/percent_used\" resource.type=\"gce_instance\" metric.label.\"state\"=\"used\""

      aggregations {
        alignment_period     = "60s"
        cross_series_reducer = "REDUCE_SUM"
        per_series_aligner = "ALIGN_MEAN"
      }

Мой вопрос следующий: могу ли я создать один блок condition_absent в terraform вместо многих и отправить одно уведомление вместо тонн в случае остановки одного из показателей работать?

1 Ответ

0 голосов
/ 25 февраля 2020

Я решил эту проблему, добавив предупреждение мониторинга времени работы агента мониторинга c. Он правильно показывает, когда виртуальная машина недоступна (при перегрузке и т. Д. c.)

...