ОБНОВЛЕНИЕ: После дополнительных поисков и поисков я обнаружил, что поток Tensor не поддерживает CUDA 10.1 и поддерживает только VUDA 10.0 с февраля 2019 года. Поэтому мне придется перейти на CUDA 10.0 для работы с текущим TF версия
TLDR: CUDA установлена и CUDNN работает, но я не могу заставить Tensorflow распознать мой NVIDIA GEFORCE RTX 2070, он показывает только мой ЦП как доступные устройства. Запустив это.
from tensorflow.python.client import device_lib
device_lib.list_local_devices()
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 14262450855498090337, name: "/device:XLA_CPU:0"
device_type: "XLA_CPU"
memory_limit: 17179869184
locality {
}
incarnation: 1345793131978591054
physical_device_desc: "device: XLA_CPU device"]
Длинная версия
Я пытаюсь использовать Cuda на Ubnutu, чтобы уменьшить время обучения для моих алгоритмов машинного обучения.
Керас == 1.0.7
TensorFlow = 1.13.1
Этот вопрос похож, но не помогает. Мои результаты также хороши.
Как проверить, правильно ли установлена cuda на Anaconda
Драйверы Nvidia (10.1) в соответствии с требованиями моей видеокарты (NVIDIA RTX 2070):
nvidia-smi
Mon Apr 15 18:39:13 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 418.56 Driver Version: 418.56 CUDA Version: 10.1 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce RTX 2070 Off | 00000000:01:00.0 Off | N/A |
| N/A 42C P8 7W / N/A | 0MiB / 7952MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
Затем проверьте мою установку CUDA: (10.1, как того требует моя видеокарта)
nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Fri_Feb__8_19:08:17_PST_2019
Cuda compilation tools, release 10.1, V10.1.105
Пока все выглядит хорошо. Но когда я пытаюсь
Проверьте мою установку Cuda и Cudnn
Здесь много текста, но я выполнил следующие команды.
cd cudnn_samples_v7/mnistCUDNN/
make clean && make
result is successful
./mnistCUDNN
lots of text followed by:
Result of classification: 1 3 5
Test passed!
Итак, после всех этих проверок кажется, что CUDA и CUDNN запущены и работают в моей системе. Однако, когда я пытаюсь проверить в TensorFlow или в Keras, он не показывает мой GPU как доступный.
from tensorflow.python.client import device_lib
device_lib.list_local_devices()
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 14262450855498090337, name: "/device:XLA_CPU:0"
device_type: "XLA_CPU"
memory_limit: 17179869184
locality {
}
incarnation: 1345793131978591054
physical_device_desc: "device: XLA_CPU device"]
Я следовал этому руководству для версии Tensorflow с поддержкой графического процессора.
https://medium.com/@cjanze/how-to-install-tensorflow-with-gpu-support-on-ubuntu-18-04-lts-with-cuda-10-nvidia-gpu-312a693744b5
Он показал NVIDIA GEFORCE RTX 2070 как доступный