Одна из моих задач в ECS fargate - это остановка и перезапуск, что кажется случайным образом. Я начал задание в De c 2019, и с тех пор оно трижды останавливалось / перезапускалось. Я обнаружил, что задача остановлена и перезапущена из журнала «События» (изображение ниже) , но информация о том, почему она остановилась, не предоставлена.
Итак, что я пытался сделать на сегодняшний день для отладки, это
- Проверено «Остановленные» задачи внутри кластера, чтобы узнать, почему он мог остановиться. , Здесь не повезло, так как кажется, что «Остановленные» задачи удерживаются там только в течение короткого периода времени.
- Проверены журналы CloudWatch на наличие любых сообщений журнала, которые могут иметь отношение к этой проблеме, ничего не найдено
- Проверенные журналы событий CloudTrail для любого события, имеющего отношение к этой проблеме, ничего не найдено
- Подтверждено, что использование памяти и ЦП является достаточным для задачи, фактически задача никогда не достигает 30% своих ограничений
- Чтение несколько AWS веток о похожих проблемах, где решения в основном связаны с использованием ELB, которым я не являюсь.