Лучшие практики для обновления CUDA и cuDNN для тензорного потока - PullRequest
0 голосов
/ 07 мая 2018

В настоящее время я отвечаю за то, чтобы настроить tenorflow-gpu 1.8 на моей машине. Я использую tf-gpu 1.2 до сих пор, но из-за некоторых необходимых функций мне нужно обновить установку.

Прежде чем сделать это, я хотел проверить, есть ли лучший способ сделать это. Моя текущая настройка выглядит так:

  • Ubuntu 16.04
  • NVIDIA GeForce GTX 1080 Ti
  • Версия драйвера NVIDIA: 384.111
  • Anaconda 4.4.0 для Python 3
  • CUDA v8.0
  • cuDNN v5.1
  • tenorflow-gpu v1.2

Как написано на домашней странице tf, мне придется использовать CUDA v9.0, а также cuDNN v7.1. Поскольку все эти инструкции относятся к чистой установке, а не к обновлению, я не уверен, будет ли лучше сначала удалить старые версии.

Пожалуйста, поделитесь своим опытом, если у вас уже была такая же проблема. Спасибо!

Ответы [ 2 ]

0 голосов
/ 08 мая 2018

Спасибо @ Жоао Габриэль С.Ф. Мне удалось успешно удалить CUDA 8.0 / cuDNN 5.1 и установить последнюю версию tenorflow. Поскольку вся процедура меня немного смутила, я решил опубликовать краткий обзор и, возможно, помочь людям в такой же ситуации.

деинсталлировать

Во-первых, я удалил cuda и все его зависимости. Поскольку я установил его через менеджер пакетов, я использовал apt-get, чтобы удалить его. Для установок с помощью runfile вы можете проверить this .

sudo apt-get --purge remove cuda
sudo apt-get autoremove
dpkg --list |grep "^rc" | cut -d " " -f 3 | xargs sudo dpkg --purge

Кроме того, я проверил все папки cuda в /usr/local/ и удалил их. Что касается cuDNN, то путем удаления всех папок cuda были удалены соответствующие заголовки и библиотеки cuda. ​​

INSTALL

Сначала проверьте драйвер видеокарты. CUDA 9.0 работает с драйвером v384.111 (поэтому не требуется 390.xxx), поэтому мне здесь нечего было делать.

Я скачал CUDA Toolkit 9.0 здесь как deb (локальный). В этой же папке я выполнил

dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64-deb
sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

Затем установите переменные окружения:

export PATH=${PATH}:/usr/local/cuda-9.0/bin
export CUDA_HOME=${CUDA_HOME}:/usr/local/cuda:/usr/local/cuda-9.0
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/usr/local/cuda-9.0/lib64

После этого я проверил мою установку, как описано здесь .

Я скачал cuDNN 7.1 из архива как tarball и установил его через

tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h \ 
/usr/local/cuda/lib64/libcudnn*

После запуска Python bash я смог импортировать тензорный поток и запустить простой график.

Еще раз спасибо и хорошей недели!

0 голосов
/ 07 мая 2018

См. эту документацию . Говорят, сначала всегда удаляйте старую версию из cuda. ​​

и поскольку cuda 9.1 требует версию драйвера> = 390. Было бы хорошо, чтобы удалить ваш текущий драйвер. Но не стоит беспокоиться, потому что драйвер 390 поставляется с cuda 9.1 при установке.

Теперь, в качестве личного совета, я бы сказал, чтобы удалить почти все (кроме python), связанные с nvidia / cuda. По некоторым причинам это довольно легко испортить при установке и настройке CUDA в Ubuntu.

Если у вас возникли проблемы после установки, см. ubuntu-16-04-lts-login-loop-after-updates-driver-nvidia , это сообщение, на которое я ответил некоторое время назад.

...