Во время обновления (в данном случае) нашего Swarm мы должны истощить узел, обновить его, снова сделать его активным, опустошить следующий узел, et c ...
Он отлично работает для первого узла, так как загрузка контейнеров для перепланирования распределяется довольно справедливо на все оставшиеся узлы, но при сливе второго узла все становится сложнее, так как все контейнеры для перепланирования go недавно обновленного узла, который имеет (почти ) задание не выполняется.
Загрузка при запуске всех служб огромна по сравнению с обычным бизнесом, узел не может поддерживать работу, и некоторые контейнеры могут не запуститься из-за ограничений проверки работоспособности и политики max_attempts.
Знаете ли вы способа перенести и избежать этого всплеска и нежелательных результатов? (приоритет, время ожидания, стратегия обновления ...)?
Ура, Томас