CockroachDB в кластере AWS EKS - [n?] Нет магазинов при загрузке - PullRequest
0 голосов
/ 09 апреля 2020

Я пытаюсь развернуть CockroachDB: v2.1.6 в новом кластере AWS EKS. Все успешно развернуто; statefulset, службы, pv и & pv c созданы. Тома AWS EBS также успешно созданы.

Проблема заключается в том, что модули никогда не переходят в состояние ГОТОВ.

pod/cockroachdb-0   0/1     Running   0          14m
pod/cockroachdb-1   0/1     Running   0          14m
pod/cockroachdb-2   0/1     Running   0          14m

Если я «опишу» стручки, я получу следующее:

  Normal   Pulled                  46s                kubelet, ip-10-5-109-70.eu-central-1.compute.internal  Container image "cockroachdb/cockroach:v2.1.6" already present on machine
  Normal   Created                 46s                kubelet, ip-10-5-109-70.eu-central-1.compute.internal  Created container cockroachdb
  Normal   Started                 46s                kubelet, ip-10-5-109-70.eu-central-1.compute.internal  Started container cockroachdb
  Warning  Unhealthy               1s (x8 over 36s)   kubelet, ip-10-5-109-70.eu-central-1.compute.internal  Readiness probe failed: HTTP probe failed with statuscode: 503

Если я изучу журналы стручка, я увижу это:

I200409 11:45:18.073666 14 server/server.go:1403  [n?] no stores bootstrapped and --join flag specified, awaiting init command.
W200409 11:45:18.076826 87 vendor/google.golang.org/grpc/clientconn.go:1293  grpc: addrConn.createTransport failed to connect to {cockroachdb-0.cockroachdb:26257 0  <nil>}. Err :connection error: desc = "transport: Error while dialing dial tcp: lookup cockroachdb-0.cockroachdb on 172.20.0.10:53: no such host". Reconnecting...
W200409 11:45:18.076942 21 gossip/client.go:123  [n?] failed to start gossip client to cockroachdb-0.cockroachdb:26257: initial connection heartbeat failed: rpc error: code = Unavailable desc = all SubConns are in TransientFailure, latest connection error: connection error: desc = "transport: Error while dialing dial tcp: lookup cockroachdb-0.cockroachdb on 172.20.0.10:53: no such host"

Я наткнулся на этот комментарий на форуме CockroachDB (https://forum.cockroachlabs.com/t/http-probe-failed-with-statuscode-503/2043/6)

И файлы cockroach_out.log и cockroach_output1.log, которые вы мне отправили (соответствует mycockroach-cockroachdb- 0 и mycockroach-cockroachdb-2) не распечатывают ни одного хранилища, загруженного во время запуска, и префиксируют все их строки журнала с помощью n?, Указывая, что им не был присвоен идентификатор узла. Я бы сказал, что они, возможно, никогда не были должным образом инициализированы как часть кластера.

Я удалил все, включая тома pv, pv c & AWS EBS, через kubectl delete Команда и повторно применяется с той же проблемой.

Любые мысли будут очень цениться. Спасибо

1 Ответ

0 голосов
/ 09 апреля 2020

Я не знал, что вам пришлось инициализировать кластер CockroachDB после его создания. Я сделал следующее, чтобы решить мою проблему:

kubectl exe c -it cockroachdb-0 -n / bin / sh

/ таракан / таракан init

См. Здесь для получения более подробной информации - https://www.cockroachlabs.com/docs/v19.2/cockroach-init.html

После этого модули начали работать правильно.

...