Из ниоткуда один из наших серверов API начал отказывать со следующей ошибкой:
http: TLS handshake error from 172.23.88.213:17244: EOF
Он выдает эту ошибку для каждого отдельного узла в кластере, поэтому не запускается.Это началось сегодня утром без каких-либо изменений в какой-либо инфраструктуре.
То, что я пробовал, не помогло:
- Вручную перезапустите док-контейнер переплетения на главном узле.
- Завершение и перепланирование api-сервера вручную.
- Перезапуск демона Docker вручную.
- Перезапуск службы kubelet вручную.
- Убедитесь, что все сертификаты SSL действительны, которыми они являются.
- Проверка инодов, тысячи свободных.
- Пинг IP-адресов других узлов в кластере, все возвращаются нормально с потерей 0 пакетов.
- Проверка journalctl и systemctlЖурналы сервисов Kubelet и единственные существенные ошибки, которые я вижу, связаны с ошибкой установления связи TLS.
Характеристики кластера:
Cloud provider: AWS
Kubernetes version: 1.11.6
Kubelet version: 1.11.6
Kops version: 1.11
Я немного растерялся из-закак отладить это дальше.