Я столкнулся с той же проблемой и обнаружил, что в дополнение к файлу "/var/log/cuda-installer.log", в котором он предлагает посмотреть, есть также /var/log/nvidia-installer.log ». В этом файле у меня есть сообщение:
ОШИБКА: вы, похоже, используете X-сервер; пожалуйста, выйдите из X перед установкой.
(я получил ту же ошибку при попытке с cuda 10.1)
Я прошел этот этап, используя ctrl-alt-F1, чтобы открыть терминал, становится root, затем systemctl stop lightdm
. Я мог тогда запустить установку.
В сторону: после перезагрузки это было ужасно. Например, я не мог контролировать яркость экрана, центр управления nvidia больше не открывался, nvidia-smi не работал. Таким образом, в течение 5 минут я запустил nvidia-uninstall
, а затем вернулся к последнему пакету драйверов (-435).
ОБНОВЛЕНИЕ: Успех! Я перезапустил установку (cuda 10.1), но снял флажок с опции драйвера. Жаловался, но получилось. Не нужно было возиться с терминалом или даже перезагрузкой. Это ничего не сломало. И использование графического процессора в PyTorch 1.4 сработало.
Я думаю, что это сработало, потому что для 10.1 нужна как минимум версия 418, а у меня 435. Это, вероятно, не будет работать с 10.2, так как для версии 440 или позже. (Я вижу, что 440 - это последняя версия Debian sid , начиная с 1 марта, так что, может быть, она появится в Ubuntu / Mint очень скоро?)
Итак, чтобы подвести итог моего ответа: установите последний nvidia-драйвер с пакетами ОС, убедитесь, что он по крайней мере так же высок, как требуется вашей версией cuda, затем установите cuda и скажите, чтобы он не трогал драйвер.