Почему AWS Cloudwatch использует диапазон оценки при определении состояния тревоги с отсутствующими точками данных? - PullRequest
0 голосов
/ 09 ноября 2018

Из документов:

Независимо от того, какое значение вы задаете для обработки пропущенных данных, когда сигнал тревоги оценивает необходимость изменения состояния, CloudWatch пытается получить большее количество точек данных, чем указано в Периодах оценки. Точное количество точек данных, которые он пытается извлечь, зависит от продолжительности периода тревоги и от того, основано ли оно на метрике со стандартным или высоким разрешением. Временной интервал точек данных, которые он пытается получить, составляет диапазон оценки .

Далее в документах приведен пример тревоги с «EvaluationPeriods» и «DatapointsToAlarm», установленными в 3. Они утверждают, что Cloudwatch выбирает 5 самых последних точек данных. Часть моего вопроса: Где они получают 5? Это не ясно из документов.

Вторая часть моего вопроса: почему такое поведение вообще (или, по крайней мере, почему оно по умолчанию) ? Если я установлю период оценки на 3, для моих точек данных на Тревогу на 3 и скажу Cloudwatch на «TreatMissingData» как «нарушение», я буду ожидать, что 3 периода отсутствия данных вызовут состояние тревоги. Это не обязательно происходит, как показано на примере в документации.

1 Ответ

0 голосов
/ 20 мая 2019

У меня были те же вопросы. Насколько я могу судить, 5 можно объяснить, если я правильно думаю о стандартных интервалах сбора и стандартном разрешении. Другими словами, если принять стандартный интервал сбора в 5 минут и стандартное разрешение в 1 минуту, то в течение 5 минут после интервала сбора будут собраны 5 отдельных точек данных. В примере указывается, что вам нужно 3 точки данных за 3 периода оценки, что меньше, чем 5 точек данных, собранных CloudWatch. CloudWatch тогда будет иметь все необходимые точки данных в пределах диапазона оценки с 5 точками данных, определенного одной коллекцией. Например, если 4 из 5 ожидаемых точек данных отсутствуют в коллекции, у вас есть одна определенная точка данных и, таким образом, вам нужно еще 2 в пределах диапазона оценки, чтобы достичь трех, необходимых для оценки тревоги. Эти 2 (а не 4, которые фактически отсутствуют в коллекции) считаются «отсутствующими» точками данных в документации - я нахожу это запутанным. Таблицы в документации AWS содержат примеры того, как различные обработки «пропущенных» двух точек данных влияют на оценки аварийных сигналов.

Независимо от того, является ли это правильной интерпретацией, это может быть лучше объяснено в документации.

...