GPU nvidia-docker в контейнере Docker - PullRequest
0 голосов
/ 23 апреля 2019

Я пытаюсь повторить работу / эксперименты, которые требуют от меня этого конкретного руководства по настройке Jupyter + Tensorflow + Nvidia GPU + Docker + Google Compute Engine .'

Я могу успешно установить nvidia-docker.Однако в учебнике в разделе Verify the GPU is Visible from a Docker Container при попытке запустить

sudo nvidia-docker-plugin

появляется следующая ошибка (см. Последнюю строку):

nvidia-docker-plugin | 2019/04/23 15:17:47 Loading NVIDIA unified memory
nvidia-docker-plugin | 2019/04/23 15:17:47 Loading NVIDIA management library
nvidia-docker-plugin | 2019/04/23 15:17:47 Discovering GPU devices
nvidia-docker-plugin | 2019/04/23 15:17:47 Provisioning volumes at /var/lib/nvidia-docker/volumes
nvidia-docker-plugin | 2019/04/23 15:17:47 Serving plugin API at /run/docker/plugins
nvidia-docker-plugin | 2019/04/23 15:17:47 Serving remote API at localhost:3476
nvidia-docker-plugin | 2019/04/23 15:17:47 Error: listen tcp 127.0.0.1:3476: bind: address already in use

И когда я запускаю

sudo nvidia-docker run --rm nvidia/cuda nvidia-smi

Я получаю следующую ошибку executable file not found in $PATH": unknown:

docker: Error response from daemon: OCI runtime create failed: container_linux.go:345: starting container process caused "exec: \"nvidia-smi\": executable file not found in $PATH": unknown.
ERRO[0000] error waiting for container: context canceled 

Я довольно новичок в докере;таким образом, было бы хорошо, если бы кто-то мог помочь мне пройти через решение.Я пытался искать ответов , но сам процесс решения проблемы уклоняется от меня.Любая помощь будет высоко оценен.

РЕДАКТИРОВАТЬ: Я установил экземпляр GCE, как указано в руководстве (например, Ubuntu 16.04 LTS, загрузочный диск 50 ГБ, 1 графический процессор, с Jupyter и тензорная доска)

1 Ответ

2 голосов
/ 01 мая 2019

Чтобы решить первое, похоже, nvidia-docker-plugin уже запущен. Чтобы найти эту услугу, используйте:

sudo netstat -tlpn | grep 3476

И убей его:

sudo pkill nvidia-docker

Во-вторых, установите nvidia-docker2 и перезагрузите конфигурацию демона Docker с помощью:

curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
  sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
  sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update

# Install nvidia-docker2 and reload the Docker daemon configuration
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd

Ссылки для более подробной информации:

...