TensorFlow 1.12 (и даже более поздние версии 1.13.1 и 2.0.0-alpha0) могут быть не построены против CUDA 10.1, поэтому могут считаться несовместимыми.
Я пробовал строитьTensorFlow из источника с поддержкой GPU.Рассмотренными версиями TensorFlow были 1.13.1 и 2.0.0-alpha0 .Машина, которую я использовал, работает на CentOS 7.6 с GCC 4.8.5.У меня установлена версия драйвера NVIDIA 418.67 (которая имеет дату выпуска 2019.5.7 и поддерживает CUDA Toolkit 10.1).
Мне удалось создать обе версии TensorFlow с CUDA 10.0 и cuDNN 7.6.0 + NCCL 2.4.7 (для CUDA 10.0). Обратите внимание, что вам не нужно подключать GPU к машине (особенно если вы используете виртуальную машину в облаке), когда вы создаете TensorFlow с поддержкой GPU.
Однако когда я переключился на CUDA 10.1 и cuDNN 7.6.0 + NCCL 2.4.7 (для CUDA 10.1), ни одна из этих версий TensorFlow не могла быть построена.Помимо изменений местоположения libcublas
, еще один источник ошибки - libcudart.so*
, не найден в cuda-10.1/lib64/
(хотя они существуют в cuda-10.0/lib64/
).