Отладка завершения узла Kubernetes - PullRequest
0 голосов
/ 05 сентября 2018

Прошлой ночью мой кластер Kubernetes проверил 2 моих узла, и я не могу понять детали того, что произошло.

kubectl describe nodes дает следующее на узлах, которые вышли из строя

Conditions:
Type                 Status  LastHeartbeatTime                 LastTransitionTime                Reason                       Message
----                 ------  -----------------                 ------------------                ------                       -------
NetworkUnavailable   False   Tue, 04 Sep 2018 21:57:00 +0000   Tue, 04 Sep 2018 21:57:00 +0000   RouteCreated                 RouteController created a route
OutOfDisk            False   Wed, 05 Sep 2018 12:12:33 +0000   Tue, 04 Sep 2018 21:56:27 +0000   KubeletHasSufficientDisk     kubelet has sufficient disk space available
MemoryPressure       False   Wed, 05 Sep 2018 12:12:33 +0000   Tue, 04 Sep 2018 21:56:27 +0000   KubeletHasSufficientMemory   kubelet has sufficient memory available
DiskPressure         False   Wed, 05 Sep 2018 12:12:33 +0000   Tue, 04 Sep 2018 21:56:27 +0000   KubeletHasNoDiskPressure     kubelet has no disk pressure
Ready                True    Wed, 05 Sep 2018 12:12:33 +0000   Tue, 04 Sep 2018 21:57:01 +0000   KubeletReady                 kubelet is posting ready status

Итак, я знаю, что OutOfDisk, MemoryPressure and DiskPressure все были в состоянии ошибки в какой-то момент прошлой ночью, но что вызвало это?

Я тоже проверил kubectl get events --all-namespaces и ничего не получил.

Наконец kubectl describe pods просто дал мне эту бесполезную информацию

State:          Running
  Started:      Tue, 04 Sep 2018 22:03:47 +0000
Last State:     Terminated
  Reason:       Error
  Exit Code:    1
  Started:      Thu, 30 Aug 2018 14:36:48 +0000
  Finished:     Tue, 04 Sep 2018 21:25:16 +0000

Есть ли способ сделать вскрытие по этому вопросу? Я хотел бы знать больше, чем это было просто не хватает места на диске.

1 Ответ

0 голосов
/ 05 сентября 2018

Я бы порекомендовал вам прочитать следующую документацию: https://kubernetes.io/docs/tasks/administer-cluster/out-of-resource/

Первая мысль, которая пришла мне в голову, - это изучение логов ваших узлов / модулей.

kubectl logs
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...