AWS Тревога мониторинга Cloudwatch срабатывает, когда экземпляр выключен - PullRequest
0 голосов
/ 29 апреля 2020

У меня есть несколько сигналов тревоги, чтобы проверить, когда экземпляр остается бездействующим. В следующих случаях для 12 последовательных точек данных (по 5 минут каждый) в среднем используется процессор <1%, экземпляр должен быть остановлен и отправлено уведомление по электронной почте. </p>

Созданный мной сигнал тревоги гласит:

Whenever _Average_ of _CPU Utilization_
is _<_ +1+ Percent
For at least _12_ consecutive periods of _5 minutes_

Тревога

Тревога срабатывает в том случае, если экземпляр работает и работает в течение 1 часа с использованием ЦП <1%. </p>

Однако сигнал тревоги также срабатывает при отключении экземпляра. Например, если экземпляр включен, имеет 30 минут точек данных <1% ЦП, а затем выключен, сигнал тревоги будет активирован через 30 минут. </p>

Метрики ЦП

Как настроить этот будильник так:

  1. срабатывает только при работающем экземпляре, или

  2. срабатывает только тогда, когда фактически собран полный набор из 12 последовательных точек данных, а не пропущенных точек, которые регистрируются как <1%? </p>

Ответы [ 2 ]

2 голосов
/ 29 апреля 2020

Ответ на этот вопрос был довольно простым. Если вы go в Cloudwatch, выберите будильник и прокрутите вниз до «Дополнительные настройки». Для обработки отсутствующих данных выберите «Обрабатывать отсутствующие данные как хорошие (не нарушая тревогу)».

1 голос
/ 30 апреля 2020

Также как AWS говорит:

Для каждого аварийного сигнала вы можете указать CloudWatch для обработки пропущенных точек данных как любое из следующего:

  • отсутствует: аварийный сигнал не учитывает пропущенные точки данных при оценке необходимости изменения состояния (по умолчанию)
  • notBreaching: пропущенные точки данных обрабатываются как начинающиеся в пределах порога
  • нарушение: пропущенные точки данных рассматриваются как нарушение порога
  • игнорировать: текущее состояние тревоги сохраняется
...