Мы пытаемся реализовать скрипт резервного копирования, который архивирует тома докера на главном роевом узле.Любой контейнер, в котором хранятся данные тома, ограничен этим главным узлом.Наш скрипт резервного копирования при запуске выполняет следующее:
Суммировано:
1. systemctrl stop docker
2. tar -cjvf ${BACKUP_PATH}/scuba-backup-$(date +%Y-%m-%d-%H%M).tar.bz /var/lib/docker/volumes/ /var/lib/docker/swarm/
3. systemctrl start docker
Это, похоже, работало некоторое время нормально.Мы ранее восстановили из резервных копий.
Во время тестирования на этой неделе мы не смогли восстановить.У нас есть несколько контейнеров, которые выдают примерно одно и то же сообщение:
{"CurrentState":"Failed 32 seconds ago","DesiredState":"Shutdown","Error":"\"starting container failed: container d00fe20ee9f7e9255acb48ce0ed0e8cc308752ee8076b3ae8bf3cf0797b97e0b: endpoint create on GW Network failed: failed to create endpoint gateway_46b8f70a043c on network docker_gwbridge: adding interface veth236e904 to bridge docker_gwbridge failed: exchange full\"","ID":"6biwbxin9id73whrk12mqmtux","Image":"scuba/as-backend:dev-latest@sha256:6b023f01970926699e327a0b7e773a1edd9bb063895240115f490f3b911eb0f0","Name":"scuba_analysis_backend.1","Node":"scuba-master-00","Ports":""}
Мы запустили:
sudo docker container prune -f
sudo docker network prune -f
sudo docker system prune -f
Что приводит к тому, что эти резервные копии выдают сетевые ошибки?