У нас есть Azure среда, в которой мы создали AKS с 3 узлами. Все вроде бы успешно сделано. Для этой команды kubectl get pods --all-namespaces
я получаю следующий вывод
NAMESPACE NAME READY STATUS RESTARTS AGE
cattle-system cattle-cluster-agent-b84447cd7-m6k5h 0/1 CrashLoopBackOff 823 3d2h
cattle-system cattle-node-agent-rpcrw 1/1 Running 1 3d2h
cattle-system cattle-node-agent-sjllb 1/1 Running 0 3d2h
cattle-system cattle-node-agent-v8c76 1/1 Running 1 3d2h
kube-system azure-cni-networkmonitor-cpsqx 1/1 Running 0 14d
kube-system azure-cni-networkmonitor-pmrv4 1/1 Running 1 14d
kube-system azure-cni-networkmonitor-x25p7 1/1 Running 1 14d
kube-system azure-ip-masq-agent-8cds2 1/1 Running 0 14d
kube-system azure-ip-masq-agent-gmnmr 1/1 Running 1 14d
kube-system azure-ip-masq-agent-mjlh5 1/1 Running 1 14d
kube-system coredns-6c66fc4fcb-g6ssg 1/1 Running 0 14d
kube-system coredns-6c66fc4fcb-mkzn9 1/1 Running 1 14d
kube-system coredns-autoscaler-567dc76d66-5krrx 1/1 Running 0 14d
kube-system kube-proxy-h9j48 1/1 Running 1 2d20h
kube-system kube-proxy-hfqvg 1/1 Running 0 2d20h
kube-system kube-proxy-wlbdx 1/1 Running 1 2d20h
kube-system kubernetes-dashboard-9f5bf9974-955cp 1/1 Running 0 14d
kube-system metrics-server-5695787788-pxsl8 1/1 Running 0 14d
kube-system tunnelfront-746dc8557f-gsw2f 1/1 Running 0 57m
Если вы видите, модуль " cattle-cluster-agent-b84447cd7-m6k5h " собирается " CrashLoopBackOff"режим постоянно.
Ниже приведены мои исследования
> kubectl -n cattle-system get pods -l app=cattle-agent -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES
cattle-node-agent-rpcrw 1/1 Running 1 2d22h XX.XXX.XX.1 aks-agentpool-XXXX-1 <none> <none>
cattle-node-agent-sjllb 1/1 Running 0 2d22h XX.XXX.XX.X2 aks-agentpool-XXXX-2 <none> <none>
cattle-node-agent-v8c76 1/1 Running 1 2d22h XX.XXX.XX.X3 aks-agentpool-XXXX-0 <none> <none>
и
> kubectl -n cattle-system logs -l app=cattle-cluster-agent
Error from server: Get https://aks-agentpool-XXXX-1:YYYY/containerLogs/cattle-system/cattle-cluster-agent-b84447cd7-m6k5h/cluster-register?tailLines=10: dial tcp XX.XXX.XX.1:YYYY: i/o timeout
и
> kubectl -n kube-system get pods -l k8s-app=kube-dns -o custom-columns=NAME:.metadata.name,HOSTIP:.status.hostIP
NAME HOSTIP
coredns-6c66fc4fcb-g6ssg XX.XXX.XX.X2
coredns-6c66fc4fcb-mkzn9 XX.XXX.XX.X3
На последнем Команда, я считаю, что Corens не в сети на одном из рабочих узлов. Может ли это быть причиной того, что агент кластера go перешел в режим CrashLookBackOff? Если да, как я могу подключить эту сердцевину к рабочему узлу 1 онлайн? Я исчерпал все свои варианты, чтобы заставить это работать. Любая помощь будет принята с благодарностью.