Кластерный автоскалер GKE застрял в состоянии инициализации - PullRequest
1 голос
/ 29 апреля 2020

Я недавно оптимизировал использование кластера (GKE) и 2 дня go Я заметил, что мои узлы не увеличиваются или уменьшаются. Карта конфигурации автоматического масштабирования находится в режиме инициализации:

kubectl describe -n kube-system configmap cluster-autoscaler-status
Name:         cluster-autoscaler-status
Namespace:    kube-system
Labels:       <none>
Annotations:  cluster-autoscaler.kubernetes.io/last-updated: 2020-04-29 14:44:54.363091383 +0000 UTC

Data
====
status:
----
Cluster-autoscaler status at 2020-04-29 14:44:54.363091383 +0000 UTC:
Initializing
Events:  <none>

Другие кластеры содержат правильные события автоматического масштабирования. Я думаю, что я мог бы перегрузить кластер с количеством стручков. Он содержит ~ 100 пакетов / узел.

Обновление 1:

  1. Какая версия GKE работает на master ?: 1.14.10-gke.27, но я думал, что обновление до 1.15. 11-gke.9 поможет (и справится как-нибудь). Это не помогло. У нас есть другие кластеры с теми же версиями и пулами.
  2. Это происходит с какими-либо пулами узлов или происходит с указанным c одним ?: Автоматическое масштабирование карты конфигурации является своего рода "глобальным уровнем", так что все Это влияет на пулы узлов.
  3. Не могли бы вы указать размеры пула, gke-версии и параметры автоматического масштабирования?
default  OK 1.14.10-gke.27  4 (2 per zone) custom-8-45056   Container-Optimized OS (cos)    0 - 8 nodes per zone    
preemptible8-2   OK 1.14.10-gke.27  10 (5 per zone) n1-standard-8   Container-Optimized OS (cos)    0 - 20 nodes per zone   
scalability-stable-2-cpu     OK 1.14.10-gke.27 1 (0 - 1 per zone) n1-standard-2 Container-Optimized OS (cos)    0 - 4 nodes per zone

Дополнительная информация:

  1. Когда он отключил автоматическое масштабирование и включил его в каждом пуле узлов, вывод kubectl describe -n kube-system configmap cluster-autoscaler-status has changed.
  2. Я подумал, что это может произойти, когда я меняю настройки: scalability-stable-2-cpu.

1 Ответ

1 голос
/ 03 мая 2020

Через 3 дня все пришло в норму.

...