Виртуальные машины, на которых работают кластеры kubernetes, периодически отключаются - PullRequest
0 голосов
/ 10 ноября 2018

Мы запускаем несколько кластеров kubernetes на нескольких сотнях виртуальных машин. Несколько виртуальных машин отключаются каждую неделю. Мы вернем его обратно. Наши метрики показывают, что использование ЦП и памяти на этих виртуальных машинах от низкого до умеренного при их отключении. Другие показатели ВМ (например, сетевой трафик) также не указывают на какие-либо необычные шаблоны. При сбое виртуальных машин нет особых сообщений в / var / log / messages.

Kubernetes версия: 1.9 Версия ядра Linux: 4.1.12-124.19.5.el7uek.x86_64

Существуют ли другие журналы или диагностическая информация, которую мы можем проверить, чтобы выяснить причину сбоев ВМ.

1 Ответ

0 голосов
/ 12 ноября 2018

Обычно мы также проверяем журнал хоста, особенно если вы запускаете kubelet как systemd.
Существует хороший учебник по digitalocean, объясняющий journald.

https://www.digitalocean.com/community/tutorials/how-to-use-journalctl-to-view-and-manipulate-systemd-logs

Это может датьВы немного понимаете, почему ваши узлы кубе ломаются.

...