Прерывистый тайм-аут на услуги Kubernetes - PullRequest
0 голосов
/ 12 января 2020

Мне было интересно, сможет ли кто-нибудь направить меня в правильном направлении, так как я вытаскиваю свои волосы этим.

Итак, у меня запущено несколько простых сервисов (через NodePort ) и большую часть времени они работают нормально. Но время от времени мы получаем тайм-аут для служб, которые я не могу объяснить.

Я тестировал следующую командную строку, которая довольно быстро воспроизведет проблему.

while true; do clear && wget k8s-mn01:30088/CallBack/Status -O /dev/null && sleep 0.05; done

Как только проблема возникнет, я получу следующий ответ:

Resolving k8s-mn01 (k8s-mn01)... 192.168.123.101
Connecting to k8s-mn01 (k8s-mn01)|192.168.123.101|:30088... connected.
HTTP request sent, awaiting response...

В настоящее время я использую кластер BareMetal с 3 узлами, состоящий из 1 мастера и 2 рабочих. Все установлено на CentOS 7.

Kubernetes версии 1.17 устанавливается с фланелевой сетью.

Сначала (основываясь на информации о inte rnet) Я подумал, что это может быть связано отброшенные пакеты, которые я видел бы в conntrack. Но, к сожалению, это не тот случай.

И еще одна заключительная вещь, которая может вызывать интерес: когда я пытаюсь получить доступ к сервису на главном узле, он всегда терпит неудачу.

Может кто-нибудь дать мне указатели в правильном направлении?

Заранее спасибо

...