Cluster Pod не исчезают до тех пор, пока кто-либо (человек или контроллер) не уничтожит их или не произойдет неизбежная ошибка аппаратного или программного обеспечения.
Разработчики называют эти неизбежные случаи недобровольными нарушениями работы приложения. Примеры:
- аппаратный сбой физической машины, поддерживающей узел
- Администратор кластера по ошибке удаляет ВМ (экземпляр)
- провал облачного провайдера или гипервизора приводит к исчезновению ВМ
паника ядра
- узел исчезает из кластера из-за сетевого раздела кластера
- выселение модуля из-за нехватки ресурсов у узла.
За исключением условия нехватки ресурсов, все эти условия должны быть знакомы большинству пользователей; они не характерны для Кубернетов.
Разработчики называют другие случаи добровольными сбоями. К ним относятся как действия, инициированные владельцем приложения, так и действия, инициированные администратором кластера.
Типичные действия владельца приложения:
- удаление развертывания или другого контроллера, который управляет модулем
- обновление шаблона модуля развертывания, вызывающее перезапуск
- прямое удаление модуля (например, случайно)
Более подробную информацию вы можете найти здесь: kubernetes-disruption ,
приложения discruption .
Вы можете настроить Prometheus в своем кластере и измерять показатели во время сбоя.