Таким образом, цель состоит в том, чтобы создать кластер kubernetes с 4-мя raspis, одним master и 3 работниками. Я следую этому руководству. После начальной настройки кластер работает нормально, но после перезапуска становится бесполезным. После некоторого расследования я обнаружил, что есть проблема с демоном docker, не перезагружающимся после перезагрузки, который заставляет необходимые контейнеры kubernetes не запускаться. Также моя файловая система переходит в режим только для чтения после перезагрузки. Вывод sudo service docker status
показывает следующее
docker.service - Docker Application Container Engine
Loaded: loaded (/lib/systemd/system/docker.service; enabled; vendor preset: enabled)
Active: failed (Result: exit-code) since Thu 2019-10-03 12:23:57 CEST; 21min ago
Docs: https://docs.docker.com
Process: 1126 ExecStart=/usr/bin/dockerd -H fd:// --containerd=/run/containerd/containerd.sock (code=exited, status=1/
Main PID: 1126 (code=exited, status=1/FAILURE)
Oct 03 12:23:57 k8smaster-2 systemd[1]: docker.service: Service RestartSec=2s expired, scheduling restart.
Oct 03 12:23:57 k8smaster-2 systemd[1]: docker.service: Scheduled restart job, restart counter is at 3.
Oct 03 12:23:57 k8smaster-2 systemd[1]: Stopped Docker Application Container Engine.
Oct 03 12:23:57 k8smaster-2 systemd[1]: docker.service: Start request repeated too quickly.
Oct 03 12:23:57 k8smaster-2 systemd[1]: docker.service: Failed with result 'exit-code'.
Oct 03 12:23:57 k8smaster-2 systemd[1]: Failed to start Docker Application Container Engine.
Попытка выполнения любых команд докера приводит к
ERROR: Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?
, и докер был установлен через curl -sSL get.docker.com | sh && sudo usermod pi -aG docker && newgrp docker
.
Я даже не могу удалить его, потому что он не был установлен через apt-get:
sudo apt-get remove docker
Reading package lists... Done
Building dependency tree
Reading state information... Done
Package 'docker' is not installed, so not removed
0 upgraded, 0 newly installed, 0 to remove and 62 not upgraded.
Вывод journalctl -xe
ist
The unit docker.service has entered the 'failed' state with result 'exit-code'.
Oct 03 12:23:57 k8smaster-2 systemd[1]: Failed to start Docker Application Container Engine.
-- Subject: A start job for unit docker.service has failed
-- Defined-By: systemd
-- Support: https://www.debian.org/support
--
-- A start job for unit docker.service has finished with a failure.
--
-- The job identifier is 1060 and the job result is failed.
Oct 03 12:23:57 k8smaster-2 systemd[1]: docker.socket: Failed with result 'service-start-limit-hit'.
-- Subject: Unit failed
-- Defined-By: systemd
-- Support: https://www.debian.org/support
Я погуглил различные ошибки, которые у меня былиполучить, но они приводят только к ошибкам GitHub, которые были 2 года и не решены или решены с помощью решения, которое мне не помогло. (Ref. это , это и это )
Я также пытался sudo systemctl enable docker
, чтобы получить автоматический запуск при загрузке, но я недумаю, что это проблема. Похоже, что проблема конфигурации, которая может быть решена с помощью новой установки, что мне нужно избегать, если я хочу запустить кластер kubernetes, который должен иметь возможность корректно завершить работу. Я действительно надеюсь, что кто-нибудь сможет мне помочь.