Как предотвратить планирование модуля на узел после сбоя модуля в GCE? - PullRequest
1 голос
/ 05 марта 2019

У меня есть установка с отображением от 1 до 1 между модулями и узлами, где каждый узел имеет локальный ssd, и каждый модуль записывает пользовательские данные в этот ssd. Если модуль умирает незаметно, он может оставить локальный ssd в состоянии, в котором он был бы непредсказуем, если бы на него были установлены другие модули.

Я планирую использовать автоматическое масштабирование кластера, поэтому я думаю, что если я смогу предотвратить планирование контейнеров на узле, GCE удалит узел и создаст новый чистый? Как я могу предотвратить появление на узле новых модулей, запланированных на него?

1 Ответ

1 голос
/ 05 марта 2019

Я бы запустил запланированное задание (вероятно, cronjob ), которое проверяет состояние тома.Если voulme поврежден - добавьте метку к узлу - (например - volume-state=corrupted)

Запланируйте ваш Pod с помощью nodeAffinity - requiredDuringSchedulingRequiredDuringExecution и nodeSelectorпод вашей меткой

он будет высвобождать модули из узлов, которые перестают удовлетворять требованиям сходства узлов модулей.

...