Kubernetes ломается (нет ответа от kubectl
), когда у меня слишком много модулей , работающих в кластере (1000 модулей).
* ресурсов более чем достаточно (процессор и память), поэтому мне кажется, что какой-то контроллер ломается и не может обрабатывать большое количество модулей.
Рабочая нагрузка, которую мне нужно выполнить, может обрабатываться в массовом параллельном режиме, поэтому у меня большое количество модулей.
На самом деле, я хотел бы иметь возможность запускать еще 1000 раз.Может быть, даже 100 000 стручков .
Мой главный узел Kubernetes является экземпляром AWS EC2 m4.xlarge
.
Моя интуиция говорит мне, что именно производительность главного узла сдерживает кластер?
Есть идеи?
Подробности:
Я запускаю 1000 модулей в развертывании.
когда я делаю kubectl get deploy
, он показывает:
DESIRED CURRENT UP-TO-DATE AVAILABLE
1000 1000 1000 458
и через мою базу данных на стороне приложения я вижу, что работает только 458 модулей.
когда я делаю kops validate cluster
я получаю предупреждение:
VALIDATION ERRORS
KIND NAME MESSAGE
ComponentStatus controller-manager component is unhealthy
ComponentStatus scheduler component is unhealthy
Pod kube-system/kube-controller-manager-<ip>.ec2.internal
kube-system pod
"kube-controller-manager-<ip>.ec2.internal" is not healthy
Pod
kube-system/kube-scheduler-<ip>.ec2.internal
kube-system pod "kube-scheduler-<ip>.ec2.internal" is not healthy