На уровне стека-драйвера-метаданных-агента-кластера происходит большая ошибка с [2a00: 1450: 400 c: c09 :: 5f]: 443: тайм-аут ввода-вывода - PullRequest
0 голосов
/ 02 апреля 2020

У меня k8s с 1.14.10-gke.27 в Европа-запад1-й зоны .

В последние пару дней у меня в модуле kube-system ns перезагружается много стековых драйверов-метаданных-агентов-кластеров с ошибками

I0402 16:39:12.688053       1 main.go:142] All resources are being watched, agent has started successfully
I0402 16:39:12.688108       1 main.go:145] No statusz port provided; not starting a server
I0402 16:39:29.383562       1 retry.go:80] call failed with err=rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = "transport: Error while dialing dial tcp [2a00:1450:400c:c09::5f]:443: i/o timeout", retrying.
I0402 16:39:29.383667       1 retry.go:80] call failed with err=rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = "transport: Error while dialing dial tcp [2a00:1450:400c:c09::5f]:443: i/o timeout", retrying.
I0402 16:39:30.483072       1 retry.go:80] call failed with err=rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = "transport: Error while dialing dial tcp [2a00:1450:400c:c09::5f]:443: i/o timeout", retrying.
I0402 16:39:30.783091       1 retry.go:80] call failed with err=rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = "transport: Error while dialing dial tcp [2a00:1450:400c:c09::5f]:443: i/o timeout", retrying.
I0402 16:40:09.186357       1 binarylog.go:265] rpc: flushed binary log to ""
I0402 16:41:29.383025       1 binarylog.go:265] rpc: flushed binary log to ""

скриншот журналов

это проблема с сетью Google?

1 Ответ

0 голосов
/ 03 апреля 2020

Я добавляю его в качестве ответа, так как существует довольно много кода, который будет совершенно нечитаем, если я добавлю его в комментарии. Как только нам удастся выяснить решение, я отредактирую его.

Не могли бы вы выполнить эти запросы Stackdriver регистрирует и опубликовать вывод в вашем вопросе как пример кода ( использовать ctrl + k для выделенного текста)?

resource.type="k8s_container"
resource.labels.project_id="<project_id>"
resource.labels.location="<location e.g. us-central1-c>"
resource.labels.cluster_name="<cluster-name>"
resource.labels.namespace_name="kube-system"
labels.k8s-pod/app="stackdriver-metadata-agent"
labels.k8s-pod/cluster-level="true"
"oom"

resource.type="k8s_container"
resource.labels.project_id="<project-id>"
resource.labels.location="<location e.g. us-central1-c>"
resource.labels.cluster_name="<cluster-name>"
resource.labels.namespace_name="kube-system"
labels.k8s-pod/app="stackdriver-metadata-agent"
labels.k8s-pod/cluster-level="true"
severity>=WARNING
sourceLocation.file!="reflector.go"

Пожалуйста, не помещайте его в качестве скриншота, так как он совершенно бесполезен при поиске это.

...