Как успешно установить CUDA 9.2 на Ubuntu 18.04? - PullRequest
0 голосов
/ 26 сентября 2018

Пока меня не было на работе, у нас было отключение электричества.Когда я вернулся и снова включил свой компьютер, я продолжил работу с некоторыми из своих сценариев, чтобы обнаружить, что Tensorflow был сломан, проблема заключалась в том, что все файлы в / usr / local / cuda были удалены, поэтому мой первыйвопрос как это вообще возможно?

Я попытался переустановить cuda и столкнулся с проблемами загрузки, о которых я поделюсь ниже, поэтому вместо того, чтобы возиться, я подумал, что лучше всего просто переустановить xubuntuи начать все сначала, но в конечном итоге получил точно такой же груз проблем.У меня была следующая настройка:

os: xubuntu 18.04
gpu: 2 x 1080ti
cuda toolkit: 9.2
cudnn: 7.2.1
nccl: 2.2
tensorflow 1.10.1 (built from source) with python3

Это важно, потому что я знаю, что она работает, я уже несколько месяцев использую свою систему,

Начальная настройка

  1. Установите Xubuntu с USB-накопителя
  2. sudo apt-get upgrade -y;
  3. sudo add-apt-repository ppa:graphics-drivers/ppa
  4. sudo apt-get update -y;
  5. Перейдите на Additional Drivers и выберите nvidia-драйвер-396 (с открытым исходным кодом)
  6. Применить изменения
  7. Перезагрузить компьютер
  8. sudo apt-get install freeglut3 freeglut3-dev libxi-dev libxmu-dev
  9. sudo dpkg -i --force-overwrite cuda-repo-ubuntu1710-9-2-local_9.2.148-1_amd64.deb
  10. sudo apt-key add /var/cuda-repo-9-2-local/7fa2af80.pub
  11. sudo apt-get update -y;

Проблемы

Из набора инструментов nvidia cuda page , версия, которую я установил до этого, была 17.04, хотя моя Ubuntu 18.04и их шаг 4 заявил:

sudo apt-get install cuda

Это также установит проприетарный драйвер nvidia, который также можно установить, перейдя в Additional Drivers после выполнения dpkg наЗагрузите набор инструментов cuda на шаге 9 выше, который называется NVIDIA binary driver - version 396.37 from nvidia-396 (proprietary).Выполнение любого из этих действий прервется ...

Затем я наткнулся на эту ссылку , потому что у меня была следующая ошибка:

trying to overwrite '/usr/lib/x86_64-linux-gnu-libGLX_indirect.so.0' which is also in package libglx-mesa0:amd64 18.0.5-0ubuntu~18.04.1

Комментарии 6,7и 8 предложенных решений не сработали, предложение комментария 6 не могло быть реализовано, поскольку в моей системе такого файла не было, комментарии 7 и 8 привели к той же ошибке, что и выше ~.. indirect.so.0 ...

Произошло очень хорошееучебное пособие здесь , поэтому я установил пакеты на шаге 8 выше, но runfile выдает точно такую ​​же ошибку.

Поэтому я также попытался снова запустить команду установки, которая утверждает, что:

cuda: Depends: cuda-9-2 (>= 9.2.148) but it is not going to be installed
libcuda1-396 : Depends: nvidia396 (>=396.37) but is not going to be installed
nvidia-opencl-icd-396 : Depends: nvdia-396 (>=396.37) but it is not going to be installed
E: Unmet dependencies. Try 'apt --fix-broken install' with no packages (or specify a solution)

Запуск, который приводит к той же ошибке.К этому моменту я даже удалил /usr/lib/x86_64-linux-gnu-libGLX_indirect.so.0, чтобы увидеть, есть ли разница, но просто выдает ту же ошибку вместе с:

  1. sudo apt-get remove cuda
  2. sudo apt-get autoremove --purge cuda
  3. Удалены файлы cuda из / var
  4. Удалить репо в /etc/apt/sources.list.d

Я очень смущенпочему я не могу внезапно установить nvidia-драйверы и / или cuda-драйверы, так как знаю, что он работает, потому что он устанавливался месяцами без проблем ...

1 Ответ

0 голосов
/ 26 сентября 2018

Есть набор инструментов cuda https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804, который можно загрузить для 18.04. Я предлагаю вам попробовать оттуда.Ранее требовалось много обходных путей, потому что это официально не поддерживалось.

Если пакет .deb не работает для вас, пожалуйста, скачайте файл запуска.Это более интерактивный способ, и он будет работать в большем количестве случаев, чем файл deb.

РЕДАКТИРОВАТЬ: поскольку вам действительно нужен более старый выпуск, я следовал https://developer.nvidia.com/cuda-92-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1710&target_type=runfilelocal

(поэтому я снова выбрал runfile) Iудостоверился, что установил все зависимости (и избавился от проблем вашего пакета) с:

sudo apt-get install nvidia-cuda-toolkit 
sudo apt-get remove nvidia-cuda-toolkit

Затем, пошагово вставьте мои команды:

chmod +x cuda_9.2.148_396.37_linux.run
sudo ./cuda_9.2.148_396.37_linux.run

и выберите

EULA will show:
accept

You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: yes

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 396.37?
(y)es/(n)o/(q)uit: no

Install the CUDA 9.2 Toolkit?
(y)es/(n)o/(q)uit: yes

Enter Toolkit Location
 [ default is /usr/local/cuda-9.2 ]: 

/usr/local/cuda-9.2 is not writable.
Do you wish to run the installation with 'sudo'?
Note that this feature is deprecated in CUDA 9.2 and will be removed in a future release.
(y)es/(n)o: yes

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: yes

Install the CUDA 9.2 Samples?
(y)es/(n)o/(q)uit: yes

Enter CUDA Samples Location
 [ default is /home/jan ]: 

И кроме пропущенных рекомендуемых библиотек (с которыми я установил)

sudo apt-get install libglu1-mesa-dev libxi-dev libxmu-dev

Нет большей проблемы, но обязательно прочитайте и примените то, что говорит установщик, особенно PATH и LD_LIBRARY_PATH (но тогда яя уверен, что у вас нет проблем с чтением вывода, если вы разработчик;))

...