Аварийный сигнал тревоги в облаке для Redshift HealthStatus неожиданно сработал - PullRequest
0 голосов
/ 07 ноября 2019

Я настроил тревогу Cloudwatch с помощью следующей команды:

aws cloudwatch put-metric-alarm
--alarm-name mycluster-HealthStatus
--metric-name HealthStatus
--namespace AWS/Redshift
--statistic Average
--comparison-operator LessThanThreshold
--threshold 1
--period 60
--evaluation-periods 30
--datapoints-to-alarm 30
--alarm-actions mysnstopic
--dimensions Name=ClusterIdentifier,Value=mycluster

Мое намерение состояло в том, чтобы сигнал тревоги срабатывал только тогда, когда все 30 из 30 предыдущих точек данных были «нарушены», то есть Среднее (HealthStatus)<1. </p>

Однако этот сигнал тревоги сработал и отправил следующее электронное письмо:

Alarm Details:
- Name:                       rsh-rpt-se1-dat-rdb-lbx-rubicon-HealthStatus
- Description:               
- State Change:               OK -> ALARM
- Reason for State Change:    Threshold Crossed: 5 out of the last 30 datapoints were less than the threshold (1.0). The most recent datapoints which crossed the threshold: [0.0 (06/11/19 20:15:00), 0.0 (06/11/19 20:14:00), 0.0 (06/11/19 20:13:00), 0.0 (06/11/19 20:12:00), 0.0 (06/11/19 20:11:00)] (minimum 30 datapoints for OK -> ALARM transition).
- Timestamp:                  Wednesday 06 November, 2019 20:46:23 UTC
- AWS Account:                myaccount

Таким образом, 5 из последних 30 точек данных были меньше порогового значения, и в нем говорится, что минимум30 необходимы для OK -> ALARM перехода. Но мы все равно перешли.

Чего мне не хватает?

...