Задание может успешно завершиться на процессорах, но ни один из графических процессоров не используется. Когда я выполняю коды в JupyterNotebook, и консоль Jupyter отображает сообщение об ошибке: Ошибка вызова cuInit: CUDA_ERROR_NOT_INITILIZED: ошибка инициализации.
Вот информация об оборудовании и программном обеспечении:
- ОС: я пытался запустить коды в Ubuntu180403 ppc64le и RHEL76, ни одна из ОС не может запустить задание на графическом процессоре
- CUDA: 10.1.243
- Драйвер графического процессора: 418.87.00
- Набор инструментов CUDA: 10.1
- TensorFlow: 14.01a, фактически он включен в IBM Powerai CE 1.6.1
- Аппаратное обеспечение: AC922, 4 * GPU - это nvidia V100
Я попытался выполнить задание поезда CNN или просто попытаться найти локальные устройства по следующим кодам, и в списке указан только процессор.
from tensorflow.python.client import device_lib as _device_lib
_device_lib.list_local_devices()
Консоль ноутбука Jupyter показывает следующую ошибку:
[tensorflow/stream_executor/cuda/cuda_driver.cc:318]
Failed call to cuInit: CUDA_ERROR_NOT_INITILIZED: initialization error
[tensorflow/stream_executor/cuda/cuda_diagonostics.cc:169]
Retrieving CUDA diagnostic information for host: powerai
[tensorflow/stream_executor/cuda/cuda_diagonostics.cc:176]
hostname: powerai
[tensorflow/stream_executor/cuda/cuda_diagonostics.cc:200]
libcuda reported version is : 418.87.0
[tensorflow/stream_executor/cuda/cuda_diagonostics.cc:204]
kernel reported version is : 418.78.0
[tensorflow/stream_executor/cuda/cuda_diagonostics.cc:310]
kernel version seems to match BSO: 418.87.0
После этого я попытался проверить, хороша ли CUDA, запустив пример CUDA и выбрасывая CUDAошибка:
$ sudo ./deviceQuery
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 3
-> initialization error
Result = FAIL