У меня есть экземпляр AWS g3.8xlarge с их AMI Deep Learning.По некоторым причинам он не находит GPU должным образом.
Эта команда показывает, что существует 2 GPU:
$ lspci | grep -i nvidia
00:1d.0 VGA compatible controller: NVIDIA Corporation GM204GL [Tesla M60] (rev a1)
00:1e.0 VGA compatible controller: NVIDIA Corporation GM204GL [Tesla M60] (rev a1)
Но, похоже, драйвер не загружен ...
$ cat /proc/driver/nvidia/version
cat: /proc/driver/nvidia/version: No such file or directory
И, пример программы deviceQuery показывает сбой:
$ ./deviceQuery
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL