Совместим ли Tensorflow 1.12 с CUDA 10.1? - PullRequest
0 голосов
/ 28 февраля 2019

Мне удалось успешно настроить сервер Ubuntu 18.04 с nvidia-smi 418.39, версией драйвера 418.39 и CUDA 10.1

Теперь у меня есть пользователь, который хочет запустить TensorFlow, но настаивает, что этонесовместим с CUDA 10.1, только с CUDA 10. Нет ни одного заявления, подтверждающего это онлайн, нигде, которое я могу найти, равно как и в каких-либо примечаниях к выпуску патча от TF.Поскольку настройка этой системы была довольно трудной задачей, я немного сомневаюсь, чтобы попробовать понизить версию только до одной версии.

У кого-нибудь есть подтверждение, работает ли TensorFlow 1.12 с CUDA 10.1 или не работает?

Ответы [ 3 ]

0 голосов
/ 06 марта 2019

Я также могу подтвердить, что tf 1.13.1 не работает с CUDA 10.1.При импорте tenorflow вы получите следующую ошибку

ImportError: libcublas.so.10.0: не удается открыть файл общего объекта: нет такого файла или каталога

при запуске ldconfig -v выявляется разница libcublas.so.10.0 против libcublas.so.10.1.0.105

0 голосов
/ 03 июня 2019

TensorFlow 1.12 (и даже более поздние версии 1.13.1 и 2.0.0-alpha0) могут быть не построены против CUDA 10.1, поэтому могут считаться несовместимыми.

Я пробовал строитьTensorFlow из источника с поддержкой GPU.Рассмотренными версиями TensorFlow были 1.13.1 и 2.0.0-alpha0 .Машина, которую я использовал, работает на CentOS 7.6 с GCC 4.8.5.У меня установлена ​​версия драйвера NVIDIA 418.67 (которая имеет дату выпуска 2019.5.7 и поддерживает CUDA Toolkit 10.1).

Мне удалось создать обе версии TensorFlow с CUDA 10.0 и cuDNN 7.6.0 + NCCL 2.4.7 (для CUDA 10.0). Обратите внимание, что вам не нужно подключать GPU к машине (особенно если вы используете виртуальную машину в облаке), когда вы создаете TensorFlow с поддержкой GPU.

Однако когда я переключился на CUDA 10.1 и cuDNN 7.6.0 + NCCL 2.4.7 (для CUDA 10.1), ни одна из этих версий TensorFlow не могла быть построена.Помимо изменений местоположения libcublas, еще один источник ошибки - libcudart.so*, не найден в cuda-10.1/lib64/ (хотя они существуют в cuda-10.0/lib64/).

0 голосов
/ 06 марта 2019

Я могу подтвердить, что даже tf 1.13.1 работает только с CUDA 10.0 для меня, а не 10.1.Не знаю, будет ли работать символическая ссылка.Если вы попытаетесь запустить tf 1.13.1 на CUDA 10.1, он выдаст вам «ImportError: libcublas.so.10.0: невозможно открыть общий объектный файл: нет такого файла или каталога»

...