В настоящее время я не знаю возможности ограничить скорость, с которой режим роя будет запускать контейнеры.Есть запись задачи для добавления экспоненциального отката в коде и различных открытых проблем в наборе swarmkit, например, 1201 , которые могут в конечном итоге помочь в этом сценарии.В идеале у вас должен быть кластер высокой доступности с узлами, распределенными по разным AZ, и при сбое одного узла рабочая нагрузка будет мигрировать на другой узел, и у вас не будет одного перегруженного узла.
То, что вы можете использовать, это: ресурсные ограничения .Вы можете настроить каждый сервис с минимальным резервированием ЦП и памяти.Это помешало бы режиму роя планировать больше контейнеров на узле, чем он мог бы обработать во время значительного простоя.Недостатком является то, что некоторые службы могут выходить не по расписанию во время простоя, и вы не можете расставить приоритеты, которые более важны для планирования.