У меня есть служба ECS EC2, подключенная к ALB, с 3 работающими задачами.
Льготный период проверки работоспособности установлен на 7200 секунд, для ускорения может потребоваться более часа.
Развертывания выполняются через Cloud Formation, который обновляет определение задачи новым ECR-изображением.
Это запускает развертывание в ECS и успешно останавливает одну старую задачу и запускает новую задачу. Однако через 5 минут, даже несмотря на то, что ALB все еще сообщает об экземпляре как нездоровом, ECS продолжает развертывание, останавливая все старые задачи и выпуская новые, прежде чем первая новая задача станет работоспособной.
Это приводит к тому, что ALB не имеет доступных экземпляров и испытывает сбой.
Я подозреваю, что это потому, что ECS на самом деле не общается с ALB, просто потому, что ALB прекратит задание.
Я рассмотрел использование проверки работоспособности определения задачи, но у него только начальный период или льготный период, равный 300 секундам.
Есть что-нибудь очевидное, что я здесь скучаю?