Тензор потока не удалось создать сеанс: версия драйвера CUDA недостаточно для версии времени выполнения CUDA - PullRequest
0 голосов
/ 03 октября 2018

ОБНОВЛЕНИЕ: Я установил CUDA-9.0, и после запуска deviceQuery я вижу, что версия CUDA Driver и CUDA Runtime Version теперь оба 9.0.

Версия запроса устройства CUDA (API времени выполнения) (статическое связывание CUDART)

Обнаружено 1 устройство (-и), поддерживающее CUDA

Устройство 0: версия драйвера CUDA "GeForce GTX 1070"/ Runtime Version 9.0 / 9.0 CUDA Capability Major / Minor version number: 6.1 Общий объем глобальной памяти: 8112 МБ (8505655296 байт) (16) Мультипроцессоры, (128) CUDA Cores / MP: 2048 CUDA Cores GPU Макс. Тактовая частота: 1645 МГц(1,64 ГГц) Тактовая частота памяти: 4004 МГц Ширина шины памяти: 256-битный Размер кэша L2: 2097152 байта Максимальный размер текстуры (x, y, z) 1D = (131072), 2D = (131072, 65536), 3D =(16384, 16384, 16384) Максимальный размер слоистой 1D текстуры, (num) слоев 1D = (32768), 2048 слоев Максимальный размер слоистой 2D текстуры, (num) слоев 2D = (32768, 32768), 2048 слоев Общий объем постоянной памяти: 65536 байт. Общее количество разделяемой памяти на блок: 49152 байт. Общее количество регистров, доступных на блок: 65536 Размер деформации: 32. Максимальное количество потоков на мультипроцессор: 2048 Максимальное количество потоков на блок:1024 Максимальный размерный размер блока резьбы (x, y, z): (1024, 1024, 64) Максимальный размерный размер размера сетки (x, y, z): (2147483647, 65535, 65535) Максимальный шаг памяти: 2147483647байты Выравнивание текстуры: 512 байт. Одновременное копирование и выполнение ядра: Да с двумя механизмами копирования. Ограничение времени выполнения на ядрах: Да. Встроенное совместное использование GPU. Память хоста: Нет. Поддержка отображения памяти, заблокированной хостом: Да.имеет поддержку ECC: отключено. Устройство поддерживает унифицированную адресацию (UVA): да. Поддерживает запуск кооперативного ядра: да. Поддерживает запуск Multi-Device Co-op Kernel: да. Идентификатор домена PCI устройства / идентификатор шины / идентификатор местоположения: 0/1/0. Режим вычислений: <по умолчанию(несколько потоков хоста могут использовать :: cudaSetDevice () с устройством одновременно)>

deviceQuery, драйвер CUDA = CUDART, версия драйвера CUDA = 9.0, версия CUDA Runtime = 9.0, NumDevs = 1 Result = PASS

Но я все еще получаю ту же ошибку при создании сеанса в тензорном потоке.(Я удалил tenorflow и установил снова) Моя версия tenorflow - «1.10.0».

Я установил tenorflow-gpu, используя conda

2018-10-03 11:07:50.532573: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: SSE4.1 SSE4.2 AVX AVX2 FMA

2018-10-03 11:07:50.657654: I tenorflow / stream_executor / cuda / cuda_gpu_executor.cc: 897] успешное чтение узла NUMA из SysFS имело отрицательное значение (-1), но должен быть хотя бы один узел NUMA, поэтому возвращается нулевой узел NUMA 2018-10-03 11: 07: 50.658351: I tenorflow / core / common_runtime / gpu / gpu_device.cc: 1405] Найдено устройство 0 со свойствами: name: GeForce GTX 1070 major: 6 minor: 1 memoryClockRate (GHz): 1.645 pciBusID: 0000: 01: 00.0totalMemory: 7,92GiB freeMemory: 7.46GiB 2018-10-03 11: 07: 50.658367: I tenorflow / core / common_runtime / gpu / gpu_device.cc: 1484] Добавление видимых устройств GPU: 0 2018-10-03 11: 07: 50.658495: E tenorflow / core / common_runtime / direct_session.cc: 158] Внутренний: cudaGetDevice () не выполнен.Статус: версия драйвера CUDA недостаточна для версии CUDA во время выполнения. Traceback (последний вызов был последним): файл "", строка 1, в файле "/home/uday/anaconda2/envs/py36/lib/python3.6/site-packages/tenorflow / python / client / session.py ", строка 1494, в init super (Session, self). init (target, graph, config = config) Файл" / home /uday / anaconda2 / envs / py36 / lib / python3.6 / site-packages / tenorflow / python / client / session.py ", строка 626, в init self._session = tf_session.TF_NewSession (self._graph._c_graph, опция)tenorflow.python.framework.errors_impl.InternalError: Не удалось создать сеанс.

Сведения о драйвере nvidia

>>nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.130                Driver Version: 384.130                   |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1070    Off  | 00000000:01:00.0  On |                  N/A |
| N/A   43C    P8     9W /  N/A |    459MiB /  8111MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1048      G   /usr/lib/xorg/Xorg                           322MiB |
|    0      1984      G   compiz                                        65MiB |
|    0      2509      G   ...-token=CFC23952F1B00BFEF0F52F62675D8896    69MiB |
+-----------------------------------------------------------------------------+

1 Ответ

0 голосов
/ 03 октября 2018

В зависимости от установленной версии Tensorflow вам может потребоваться обновить ваш CUDA Tookit.

Все требования, перечисленные для корректной работы Tensorflow в вашей системе, можно найти здесь .Исходя из предоставленного вами вывода, ваша версия драйвера соответствует требованиям, но ваша версия времени выполнения слишком мала - ее придется обновить с 8.0 до 9.0 (НЕ 9.1, 9.2 или 10.0, хотя, если вы не собираете из исходного кода - придерживайтесьс 9.0 на данный момент, доступно с здесь ).Если вы хотите использовать другую, более высокую версию CUDA Toolkit, вы должны собрать ее из исходного кода.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...