Проблемы с добавлением хостов Rancher и поддержанием их активности - PullRequest
0 голосов
/ 17 декабря 2018

Итак, у меня работает несколько виртуальных машин, для которых я хотел бы иметь (упрощенную настройку), где у меня есть один хост (10.100.10.1) для Rancher и один хост (10.100.10.4) для запуска контейнеров.Я установил Rancher Server 1.6.25 на машину управления и версию Docker CE 18.06.1 ~ ce ~ 3-0 ~ ubuntu на обеих машинах.Они оба работают на Ubuntu 18.04 LTS.

На машине управления у меня работает nginx со следующей настройкой https://pastebin.com/KgCxQdfH, поэтому он направляет 80 трафика на 8080. Rancher был запущен с

sudo docker run -d -v <host_vol>:/var/lib/mysql --restart=unless-stopped -p 8080:8080 rancher/server. 

Я также запустил sudo ufw allow 500 / udp и sudo ufw allow 4500 / udp на обеих машинах.Кроме того, мне пришлось сделать https://docs.docker.com/install/linux/linux-postinstall/#specify-dns-servers-for-docker,, поскольку он выдавал ошибку, не делая этого.

Проблема в том, что, когда я пытаюсь добавить хост, у меня возникают проблемы с его регистрацией, и даже после того, как ему удается подключиться,Rancher изо всех сил пытается сохранить соединение активным.Когда я регистрирую агента, сначала он дает следующее:

time=“2018-12-17T13:23:28Z” level=info msg=“Host not registered yet. Sleeping 1 second and trying again. reportedUuid=a0ca6f30-a804-4227-5532-8c2692673e56 Attempt=12”
time=“2018-12-17T13:23:29Z” level=info msg=“Host not registered yet. Sleeping 1 second and trying again. reportedUuid=a0ca6f30-a804-4227-5532-8c2692673e56 Attempt=13”
time=“2018-12-17T13:23:30Z” level=info msg=“Host not registered yet. Sleeping 1 second and trying again. reportedUuid=a0ca6f30-a804-4227-5532-8c2692673e56 Attempt=14”
…
time=“2018-12-17T12:28:57Z” level=error msg=“Failed to get connection token for host-api startup: Reached max retry attempts for getting token”

Затем через некоторое время он подключается:

time=“2018-12-17T13:23:31Z” level=info msg=“Connecting to proxy.” url=“ws://10.100.10.1/v1/connectbackend?token=token”

Это занимает больше времени, чем я привык, инесколько раз он полностью проваливался, что означало, что я начал получать 401 (может быть, токен истек?) сообщения от 10.100.10.1.Но даже после того, как мне удалось подключить его, хост продолжает отключаться -> Переподключать -state в пользовательском интерфейсе.Затем в журналах Rancher-сервера я получаю следующее:

2018-12-17 13:24:06,050 ERROR [3a6531c0-b638-4494-bcad-2ee79553901e:3725] [instance:111] [instance.start->(InstanceStart)] [] [ecutorService-4] [i.c.p.process.instance.InstanceStart] Failed [Dependencies readiness error instance is not     running] for instance [111]
2018-12-17 13:24:07,047 ERROR [7c3e0b91-7037-4df2-96bd-634aba7eca39:3732] [instance:112] [instance.start->(InstanceStart)] [] [ecutorService-3] [i.c.p.process.instance.InstanceStart] Failed [Dependencies readiness error instance is not     running] for instance [112]
2018-12-17 13:24:07,048 ERROR [c995c17c-6e33-4308-b0e3-f4ded72ca0dc:3736] [instance:113] [instance.start->(InstanceStart)] [] [ecutorService-5] [i.c.p.process.instance.InstanceStart] Failed [Dependencies readiness error instance is not     running] for instance [113]
2018-12-17 13:24:11,644 ERROR [:] [] [] [] [TaskScheduler-1] [i.c.p.a.s.ping.impl.PingMonitorImpl ] Failed to get ping from agent [43] count [3]
2018-12-17 13:24:16,645 ERROR [:] [] [] [] [TaskScheduler-1] [i.c.p.a.s.ping.impl.PingMonitorImpl ] Failed to get ping from agent [43] count [4]
2018-12-17 13:24:21,645 ERROR [:] [] [] [] [TaskScheduler-1] [i.c.p.a.s.ping.impl.PingMonitorImpl ] Failed to get ping from agent [43] count [5]
2018-12-17 13:24:26,646 ERROR [:] [] [] [] [TaskScheduler-1] [i.c.p.a.s.ping.impl.PingMonitorImpl ] Failed to get ping from agent [43] count [6]
2018-12-17 13:24:26,648 ERROR [:] [] [] [] [TaskScheduler-1] [i.c.p.a.s.ping.impl.PingMonitorImpl ] Scheduling reconnect for agent [43] host [8] count [6]

Таким образом, добавленная мною виртуальная машина постоянно отключается.Это упрощенное объяснение проблемы, поэтому, если требуется дополнительная информация, я могу ее предоставить, но что именно может быть не так в настройке со следующими ограничениями:

A) Неисправность при регистрации хоста на ранчере.Может произойти сбой так долго, что он продолжит выдавать 401: Не удалось получить клиент ранчера для запуска host-api: Bad response statusCode [401].Статус [401 Несанкционированный].Тело: [code = Unauthorized, baseType = error, message = Unauthorized] из [http://10.100.10.1/v1]

B) Не удается сохранить хост в активном состоянии, если он зарегистрирован, он переходит в режим Disconnected / Reconnecting все время сАктивное подключение время от времени.

C) Если я пинг, скручивание и т. Д. Хосты, трафик, кажется, проходит через хосты нормально.

...