Я пытаюсь развернуть CockroachDB: v2.1.6 в новом кластере AWS EKS. Все успешно развернуто; statefulset, службы, pv и & pv c созданы. Тома AWS EBS также успешно созданы.
Проблема заключается в том, что модули никогда не переходят в состояние ГОТОВ.
pod/cockroachdb-0 0/1 Running 0 14m
pod/cockroachdb-1 0/1 Running 0 14m
pod/cockroachdb-2 0/1 Running 0 14m
Если я «опишу» стручки, я получу следующее:
Normal Pulled 46s kubelet, ip-10-5-109-70.eu-central-1.compute.internal Container image "cockroachdb/cockroach:v2.1.6" already present on machine
Normal Created 46s kubelet, ip-10-5-109-70.eu-central-1.compute.internal Created container cockroachdb
Normal Started 46s kubelet, ip-10-5-109-70.eu-central-1.compute.internal Started container cockroachdb
Warning Unhealthy 1s (x8 over 36s) kubelet, ip-10-5-109-70.eu-central-1.compute.internal Readiness probe failed: HTTP probe failed with statuscode: 503
Если я изучу журналы стручка, я увижу это:
I200409 11:45:18.073666 14 server/server.go:1403 [n?] no stores bootstrapped and --join flag specified, awaiting init command.
W200409 11:45:18.076826 87 vendor/google.golang.org/grpc/clientconn.go:1293 grpc: addrConn.createTransport failed to connect to {cockroachdb-0.cockroachdb:26257 0 <nil>}. Err :connection error: desc = "transport: Error while dialing dial tcp: lookup cockroachdb-0.cockroachdb on 172.20.0.10:53: no such host". Reconnecting...
W200409 11:45:18.076942 21 gossip/client.go:123 [n?] failed to start gossip client to cockroachdb-0.cockroachdb:26257: initial connection heartbeat failed: rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = "transport: Error while dialing dial tcp: lookup cockroachdb-0.cockroachdb on 172.20.0.10:53: no such host"
Я наткнулся на этот комментарий на форуме CockroachDB (https://forum.cockroachlabs.com/t/http-probe-failed-with-statuscode-503/2043/6)
И файлы cockroach_out.log и cockroach_output1.log, которые вы мне отправили (соответствует mycockroach-cockroachdb- 0 и mycockroach-cockroachdb-2) не распечатывают ни одного хранилища, загруженного во время запуска, и префиксируют все их строки журнала с помощью n?, Указывая, что им не был присвоен идентификатор узла. Я бы сказал, что они, возможно, никогда не были должным образом инициализированы как часть кластера.
Я удалил все, включая тома pv, pv c & AWS EBS, через kubectl delete Команда и повторно применяется с той же проблемой.
Любые мысли будут очень цениться. Спасибо