После нескольких дней работы dockerd
на хосте kubernetes, где pube-ы назначаются с помощью kubelet, dockerd
выходит из строя - потребляет много ресурсов (50% памяти - ~ 4 гигабайта).
Когда он достигает этого состояния, он не может воздействовать на команды для контейнеров, которые, по-видимому, запускаются через $ docker ps
. Также проверяя ps -ef
на хосте, эти контейнеры не отображаются ни на какие базовые процессы хоста.
$ docker exec
урожайность -
level=error msg="Error running exec in container: rpc error: code = 2 desc = containerd: container not found"
Cannot kill container 6a8d4....8: rpc error: code = 14 desc = grpc: the connection is unavailable"
level=fatal msg="open /var/run/docker/libcontainerd/containerd/7657...4/65...6/process.json: no such file or directory"
Просматривая дерево процессов на хосте, кажется, что существует много несуществующих процессов, которые указывают на dockerd
в качестве родительского идентификатора. Есть какие-нибудь указатели на то, что может быть проблемой или где искать дальше?
Включена отладка на dockerd
, чтобы увидеть, возникает ли проблема снова, перезапуск dockerd устраняет проблему.