torch.cuda.is_availabe () постоянно возвращает False - PullRequest
0 голосов
/ 01 октября 2019

Я в настоящее время в лаборатории в школе, в которой я учусь, и мы используем серверы GPU для наших задач. Я пытался запустить функцию torch.cuda.is_available(), но она постоянно возвращает False, несмотря на то, что я пробовал то и это.

Под "этим и тем" я конкретно имею в виду, что я пытался установить и переустановить PyTorch, я 'Убедившись, что CUDA действительно доступен, запустив команду nvidia-smi, я также проверил переменную окружения CUDA_VISIBLE_DEVICES и убедился, что она назначена правильно.

Устройства графического процессора: 0 или 1, и моя переменная окружения в настоящее время установлена ​​на 1.

В настоящее время у меня есть следующие спецификации:

ОС: Ubuntu 16.04

CUDA: 9.0176

Python: 3.7.0

cuDNN: 9.0-v7.0.5

Драйвер Nvidia: 384.81

Кто-нибудь сталкивался с этой проблемой? Если да, то как это было решено?

РЕДАКТИРОВАТЬ

В настоящее время я переустановил PyTorch из исходного кода Github, как было предложено PyTorch - Get Started - BuildingИз источника , и это исправило мою проблему. Тем не менее, для меня и сообщества в целом было бы очень полезно, если бы кто-нибудь мог дать представление о том, почему такие проблемы возникают в первую очередь. Спасибо.

РЕДАКТИРОВАТЬ 2

Как подсказал @kHarshit в комментариях, я запустил collect_env.py, расположенный в pytorch/torch/utils/, и получил следующий вывод:

Collecting Environment information...
PyTorch version: 1.3.0a0+6a4ca9a
is debug build: No
CUDA used to build PyTorch: 9.0.176

OS: Ubuntu 16.04.3 LTS
GCC version: (Ubuntu 5.4.0-6ubuntu1~16.04.10) 5.4.0 20160609
CMake version: version 3.14.0

Python version: 3.7
Is CUDA available: No
CUDA runtime version: 9.0.176
GPU models and configuration:
GPU 0: TITAN Xp
GPU 1: TITAN Xp

Nvidia driver version: 384.81
cuDNN version: Could not collect

Versions of relevant libraries:
[pip3] numpy==1.17.2
[pip3] numpydoc=0.8.0
[pip3] torch=1.3.0a0+6a4ca9a
[pip3] torch-cluster=1.4.4
[pip3] torch-geometric=1.3.1
[pip3] torch-scatter==1.3.1
[pip3] torch-sparse==0.4.0
[pip3] torch-spline-conv==1.1.0
[pip3] torchvision==0.4.0
[conda] blas                    1.0                    mkl
[conda] mkl                     2019.4                 243
[conda] mkl-include             2019.4                 243
[conda] mkl-service             2.3.0       py37he904b0f_0
[conda] mkl_fft                 1.0.14      py37ha843d7b_0
[conda] mkl_random              1.1.0       py37hd6b4f25_0
[conda] torch                   1.2.0               pypi_0     pypi
[conda] torch-cluster           1.4.4               pypi_0     pypi
[conda] torch-geometric         1.3.1               pypi_0     pypi
[conda] torch-scatter           1.3.1               pypi_0     pypi
[conda] torch-sparse            0.4.0               pypi_0     pypi
[conda] torch-spline-conv       1.1.0               pypi_0     pypi
[conda] torchvision             0.4.0               pypi_0     pypi

Я не слишком знаком с этим и не уверен, есть ли какая-либо информация, указывающая на потенциальную проблему. Если есть, кто-нибудь будет достаточно любезен, чтобы указать на это? Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...