Не могу установить Cuda 10.2 в Ubuntu 18.04 - PullRequest
0 голосов
/ 01 марта 2020

Я хочу попросить CUDA для моего проекта глубокого изучения Ubuntu. У меня установлен g cc. При попытке запустить sudo sh cuda_10.2.89_440.33.01_linux.run выдается ошибка: установка не удалась. Смотрите подробности в журнале /var/log/cuda-installer.log. Я прочитал руководство по установке (https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html), но это не помогло. Я использую Ubuntu 18.04 LTS и у меня есть GTX 1080Ti GPU. Поскольку установка cuda устанавливает драйвер для меня, я не установил требуемый драйвер. Вот журнал:

[INFO]: Driver not installed.
[INFO]: Checking compiler version...
[INFO]: gcc location: /usr/bin/gcc

[INFO]: gcc version: gcc version 7.4.0 (Ubuntu 7.4.0-1ubuntu1~18.04.1) 

[INFO]: Initializing menu
[INFO]: Setup complete
[INFO]: Components to install: 
[INFO]: Driver
[INFO]: 440.33.01
[INFO]: Executing NVIDIA-Linux-x86_64-440.33.01.run --ui=none --no-questions --accept-license --disable-nouveau --no-cc-version-check --install-libglvnd  2>&1
[INFO]: Finished with code: 256
[ERROR]: Install of driver component failed.
[ERROR]: Install of 440.33.01 failed, quitting

1 Ответ

0 голосов
/ 17 марта 2020

Я столкнулся с той же проблемой и обнаружил, что в дополнение к файлу "/var/log/cuda-installer.log", в котором он предлагает посмотреть, есть также /var/log/nvidia-installer.log ». В этом файле у меня есть сообщение:

ОШИБКА: вы, похоже, используете X-сервер; пожалуйста, выйдите из X перед установкой.

(я получил ту же ошибку при попытке с cuda 10.1)

Я прошел этот этап, используя ctrl-alt-F1, чтобы открыть терминал, становится root, затем systemctl stop lightdm. Я мог тогда запустить установку.

В сторону: после перезагрузки это было ужасно. Например, я не мог контролировать яркость экрана, центр управления nvidia больше не открывался, nvidia-smi не работал. Таким образом, в течение 5 минут я запустил nvidia-uninstall, а затем вернулся к последнему пакету драйверов (-435).

ОБНОВЛЕНИЕ: Успех! Я перезапустил установку (cuda 10.1), но снял флажок с опции драйвера. Жаловался, но получилось. Не нужно было возиться с терминалом или даже перезагрузкой. Это ничего не сломало. И использование графического процессора в PyTorch 1.4 сработало.

Я думаю, что это сработало, потому что для 10.1 нужна как минимум версия 418, а у меня 435. Это, вероятно, не будет работать с 10.2, так как для версии 440 или позже. (Я вижу, что 440 - это последняя версия Debian sid , начиная с 1 марта, так что, может быть, она появится в Ubuntu / Mint очень скоро?)

Итак, чтобы подвести итог моего ответа: установите последний nvidia-драйвер с пакетами ОС, убедитесь, что он по крайней мере так же высок, как требуется вашей версией cuda, затем установите cuda и скажите, чтобы он не трогал драйвер.

...