Как исправить ошибку dial tcp 10.96.0.1:443: ошибка тайм-аута ввода-вывода для модуля оператора, установленного через helm-rook? - PullRequest
0 голосов
/ 26 февраля 2020

Я в значительной степени добавил репо с этой командой

helm repo add rook-stable https://charts.rook.io/stable

Затем я выполнил команду

helm install --namespace rook-ceph-system <NAME> <CHART VERSION>

Оператор сначала создается, но затем превращается в ошибку crashloopbackoff.

Ниже приведен журнал.

kubectl logs  rook-ceph-operator-5bdc9cfcb9-qml5n
2020-02-26 17:42:38.863455 I | rookcmd: starting Rook v0.9.3 with arguments '/usr/local/bin/rook ceph operator'
2020-02-26 17:42:38.863570 I | rookcmd: flag values: --alsologtostderr=false, --help=false, --log-level=INFO, --log_backtrace_at=:0, --log_dir=, --logtostderr=true, --mon-healthcheck-interval=45s, --mon-out-timeout=5m0s, --stderrthreshold=2, --v=0, --vmodule=
2020-02-26 17:42:39.056154 I | cephcmd: starting operator
failed to get pod. Get https://10.96.0.1:443/api/v1/namespaces/default/pods/rook-ceph-operator-5bdc9cfcb9-qml5n: dial tcp 10.96.0.1:443: i/o timeout

Есть идеи, как это исправить?

1 Ответ

0 голосов
/ 17 марта 2020

Была такая же проблема с почти такой же настройкой. Кластер Kubernetes развернут с 3 ВМ (через бродягу). Calico как сеть pod.

Вещи, которые я исправил: объявить 3 имени хоста VM в каждом / etc / hosts

192.168.100.51  kube1   kube1
192.168.100.52  kube2   kube2
192.168.100.53  kube3   kube3

Изменить pod-network-cidr:

kubeadm init --apiserver-advertise-address=192.168.100.51 --apiserver-cert-extra-sans=192.168.100.51 --node-name kube1 --pod-network-cidr=10.10.0.0/16

Используйте тот же pod-cidr в ситце:

- name: CALICO_IPV4POOL_CIDR
  value: "10.10.0.0/16"

Развертывание грача:

git clone --single-branch --branch release-1.2 https://github.com/rook/rook.git
cd cluster/examples/kubernetes/ceph
kubectl create -f common.yaml
kubectl create -f operator.yaml
kubectl create -f cluster-test.yaml

Теперь кластер Ceph запущен и работает.

...