Docker Swarm и Kubernetes - две системы для управления приложениями на нескольких узлах.Если узел истощается или его нагрузка очень высока, они запускают некоторую процедуру для поддержания желаемого состояния, описанного в требованиях.
Конечно, когда они управляют приложением через инфраструктуру, им приходится принимать некоторые решения вДля того, чтобы изменить состояние.Как решения принимаются, чтобы гарантировать, что решения не повредят системе?
Я имею в виду, не когда инициируются действия (системный анализ), а как мы можем доказать, что принятое решениелучшее решение для решения проблемы? Есть ли какая-либо документация по этому вопросу?Я не нахожу никаких ссылок на эту тему.
Например: у меня есть узел, ресурсы которого практически бесплатны.Затем, в определенный момент, их ресурсы стали недостаточными и остаются недостаточными только на секунду, а затем возвращаются бесплатно.Если менеджер переносит приложения с этого узла на другой из-за того, что эта секунда нехватки ресурсов вызывает срабатывание функций миграции, возможно, это создаст больше проблем, чем решенных, поскольку проблема с недостаточными ресурсами уже пройдена, и миграция на самом деле не требовалась.