Я определил тревогу CloudWatch для уменьшения масштаба AWS ECS.
Обычно работает нормально.но иногда это терпит неудачу с ошибкой ниже.500 является порогом для горизонтального масштабирования.Метрическое время каждые 5 минут.и точка масштабирования datapoint равна 1 из 2 (означает, что одно значение превышает пороговое значение за 10 минут):
"error": "Не найдена корректировка шага для значения метрики [437.08774491907025, 516.9558339660845] и порог нарушения500,0 "
Шаг настройки определяется следующим образом:
step_adjustment {
metric_interval_lower_bound = 0
scaling_adjustment = 1
}
Конфигурация тревоги:
datapoints_to_alarm = "1"
evaluation_periods = "2"
threshold = "500"
Код Terraform для создания тревоги
resource "aws_appautoscaling_policy" "task_count_up" {
name = "appScalingPolicy_${aws_ecs_service.sqs_to_kinesis.name}_ScaleUp"
service_namespace = "ecs"
resource_id = "service/${aws_ecs_cluster.shared-elb-access-logs-processor.name}/${aws_ecs_service.sqs_to_kinesis.name}"
scalable_dimension = "ecs:service:DesiredCount"
step_scaling_policy_configuration {
adjustment_type = "ChangeInCapacity"
cooldown = "${var.scale_up_cooldown_seconds}"
metric_aggregation_type = "Maximum"
step_adjustment {
metric_interval_lower_bound = 0
scaling_adjustment = 1
}
}
depends_on = [
"aws_appautoscaling_target.main",
]
}
resource "aws_appautoscaling_policy" "task_count_down" {
name = "appScalingPolicy_${aws_ecs_service.sqs_to_kinesis.name}_ScaleDown"
service_namespace = "ecs"
resource_id = "service/${aws_ecs_cluster.shared-elb-access-logs-processor.name}/${aws_ecs_service.sqs_to_kinesis.name}"
scalable_dimension = "ecs:service:DesiredCount"
step_scaling_policy_configuration {
adjustment_type = "ChangeInCapacity"
cooldown = "${var.scale_down_cooldown_seconds}"
metric_aggregation_type = "Minimum"
step_adjustment {
metric_interval_upper_bound = 0
scaling_adjustment = -1
}
}
depends_on = [
"aws_appautoscaling_target.main",
]
}