сбой при работе tenorflow-gpu в LINUX - PullRequest
0 голосов
/ 15 сентября 2018

Я установил CUDA и cuDnn в Ubuntu 16.04.

Версия CUDA: 9.0 // с версией драйвера 390.87

версия cuDNN: 7.2 для CUDA9.0

import tensorflow as tf

отлично работает, но

tf.Session() 

выводит следующую ошибку.

2018-09-15 16:43:23.281375: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1484] Adding visible gpu devices: 0
2018-09-15 16:43:23.281431: E tensorflow/core/common_runtime/direct_session.cc:158] Internal: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
 File "/home/imhgchoi/anaconda3/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 1494, in __init__
super(Session, self).__init__(target, graph, config=config)
 File "/home/imhgchoi/anaconda3/lib/python3.6/site-packages/tensorflow/python/client/session.py", line 626, in __init__
self._session = tf_session.TF_NewSession(self._graph._c_graph, opts)
tensorflow.python.framework.errors_impl.InternalError: Failed to create session.

Сообщение об ошибке означает, что я установил не ту версию драйвера CUDA, но я потерян. Я не уверен, какие шаги предпринять, чтобы исправить эту ситуацию.


ПОСЛЕ ДОБАВЛЕНИЯ ПЕРЕМЕННЫХ ОКРУЖАЮЩЕЙ СРЕДЫ

Это только добавило новые ошибки ..

2018-09-15 17:13:39.684390: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: SSE4.1 SSE4.2 AVX AVX2 FMA
2018-09-15 17:13:39.767963: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:897] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
2018-09-15 17:13:39.768481: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1405] Found device 0 with properties: 
name: GeForce GTX 1050 Ti major: 6 minor: 1 memoryClockRate(GHz): 1.506
pciBusID: 0000:09:00.0
totalMemory: 3.94GiB freeMemory: 3.41GiB
2018-09-15 17:13:39.768502: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1484] Adding visible gpu devices: 0
2018-09-15 17:13:39.768635: E tensorflow/core/common_runtime/direct_session.cc:158] Internal: cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version

1 Ответ

0 голосов
/ 15 сентября 2018

Может быть, это ваши переменные окружения, вызывающие эту проблему. попробуйте это:

Добавьте эти строки в конец файла ~ / .bashrc, откройте терминал и просто запустите там сеанс python, а затем импортируйте tenorflow (у вас должен быть установлен tenporflow-gpu через apt) и посмотрите, работает ли он:

sudo vim ~/.bashrc

и добавьте их в конец файла и перезапустите ваш терминал:

export CUDA_HOME="/usr/local/cuda-9.0"
export LD_LIBRARY_PATH="${CUDA_HOME}/lib64"
export PATH="${CUDA_HOME}/bin:${PATH}"
export DYLD_LIBRARY_PATH="${CUDA_HOME}/lib"

Edit.1

Пожалуйста, убедитесь, что «usr / local / cuda-9.0» - это каталог, в который вы установили cuda. ​​

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...