Tensorflow / NVIDIA / CUDA докер несовместимые версии - PullRequest
0 голосов
/ 28 марта 2019

Я пытаюсь использовать tenorflow и nvidia с докером, но появляется следующая ошибка:

docker run --runtime = nvidia -it --rm tenorflow / tenorflow: latest-gpu python -c "импортировать тензорный поток как tf; tf.enable_eager_execution (); print (tf.reduce_sum (tf.random_normal ([1000, 1000])))" *

docker: ответ об ошибке от демона: создание среды выполнения OCI не удалось:container_linux.go: 344: запуск процесса контейнера вызван "process_linux.go: 424: запуск контейнера вызван \" process_linux.go: 407: запуск предварительного запуска ловушки 1 вызвал \\ "ошибка запуска обработчика: выход из состояния 1, stdout:, stderr: execкоманда: [/ usr / bin / nvidia-container-cli - load-kmods configure --ldconfig=@/sbin/ldconfig.real --device = все --compute --utility --require = cuda> = 10.0 бренд= tesla, водитель> = 384, водитель <385 --pid = 5393 /var/lib/docker/overlay2/......./merged]\\nnvidia-container-cli: ошибка требования: неудовлетворительное состояние: торговая марка= tesla \\ n \\ "\" ": неизвестно. </p>

При попытке запустить nvidia-smi появляется похожая ошибка:

docker run --runtime = nvidia --rm nvidia / cuda nvidia-smi

но при попытке запустить nvidia-smi с помощью cuda: 9.0-base, это работаеткак талисман:

Docker run --runtime = nvidia --rm nvidia / cuda: 9.0-base nvidia-smi

Нужно ли мне убедиться, что cuda10 работает или я могу запустить tenorflow с cuda 9?И как я могу запустить образ докера tenorflow с помощью cuda: 9.0-base?(все еще докер).

Большое спасибо!

1 Ответ

1 голос
/ 28 марта 2019

Хорошо, я, наконец, начинаю выяснять беспорядок на моей машине.

Тензор потока изображения не заботится о версии изображения CUDA, он не использует изображение CUDA Docker. Он заботится о моих драйверах nvidia, поскольку в него встроен CUDA в образ тензорного потока.

(образ докера cuda, который работает с моими текущими драйверами, это cuda: 9.0)

Это означало, что мне нужно найти образ тензорного потока, который работает с моими драйверами (390.116), или обновить драйверы.

Я пробовал ту же команду с tenorflow: 1.12.0-gpu-py3, и у нее не было никаких проблем.

...