Сигналы тревоги AWS Cloudwatch не возвращаются в состояние OK из состояния тревоги, уведомляя тему SNS в течение трех последовательных периодов - PullRequest
0 голосов
/ 05 февраля 2019

Я создал ALARM для лямбды ([ОШИБКИ]) в пользовательском фильтре метрик.Ниже приведена конфигурация для метрического фильтра и аварийного сигнала.

logs.put_metric_filter(
        logGroupName='/aws/lambda/' + functionname,
        filterName=functionname +'_error_stage',
        filterPattern='"ERROR"',
        metricTransformations=[
            {
                'metricName': functionname +'_error_stage',
                'metricNamespace': 'lamda_error',
                'metricValue': '1',
                'defaultValue': 0
            },
        ]
    )

Конфигурация для метрического аварийного сигнала.

cloudwatch.put_metric_alarm(
        ActionsEnabled=True,
        AlarmActions=[
            "arn:aws:sns:us-west-2:653453327677:logs_error_mail"
        ],
        AlarmName=alarm_name,
        ComparisonOperator= "GreaterThanOrEqualToThreshold",
        EvaluationPeriods=1,
        InsufficientDataActions=[],
        MetricName=function_name + '_error_stage',
        Namespace="lamda_error",
        OKActions=[],
        Period=300,
        Statistic="Sum",
        Threshold=1.0,
        TreatMissingData="missing"
    )

Работает все нормально, но проблема заключается в том, что всякий раз, когда срабатывает аварийный сигнал, он также запускается дляследующие 3 последовательных периода.Это связано с тем, что аварийные сигналы не возвращаются в нормальное состояние через пять минут.Как изменить конфигурацию, чтобы она не запускалась ложно.

...