Kubernetes NodeLost / NotReady / Диски с высоким IO - PullRequest
0 голосов
/ 23 мая 2018

Я испытываю очень сложную проблему с Kubernetes в моих производственных средах, теряющих все свои Узлы агента, они переходят с Готов на NotReady, все модули переходят из состояния Выполнение в состояние NodeLost.Я обнаружил, что Kubernetes интенсивно использует диски:

Agent Node Usage

Agent Node Usage 2

Kubectl get nodes

enter image description here

Мой кластер развернут с использованием ACS-движка 0.17.0 (и я тоже тестировал предыдущие версии, и то же самое произошло).

С другой стороны, мы решили развернуть серию VM Standard_DS2_VX, которая содержит диски Premium, и мы увеличили IOPS до 2000 (ранее он был ниже 500 IOPS), и произошло то же самое.Я собираюсь попробовать большее число.

Любая помощь по этому вопросу будет оценена.

1 Ответ

0 голосов
/ 05 октября 2018

Это был микросервис, истощающий ресурсы, и тогда Kubernetes просто остановил узлы.Мы работали над установкой ресурсов / лимитов, чтобы избежать разрушения всего кластера.

...