Ошибка создания cuDNN не удалось инициализировать - PullRequest
0 голосов
/ 18 марта 2020

Я пытаюсь обучить VGGNET модель на пользовательском наборе данных, я экспериментировал с моделью на colab, но теперь мне нужно запустить тот же код на локальной машине.

Я попытался запустить код с Tensorflow GPU 1.15 и CUDA 10.0 (я использую colab имеет Tensorflow GPU 1.15 и CUDA 10.0), но код выдает эту ошибку

...
  (0) Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
     [[{{node block1_conv1/convolution}}]]
     [[loss/mul/_169]]
...

То, что я пытался

  • Пробовал разные версии cuDNN 7.6.4 и 7.4.2
  • Пробовал понизить версию Tensorflow GPU до 1.14 с 1.15

Я также прошел через эти посты post1 , post2 , но я не смог устранить ошибку

Система: Ubuntu 18.04, CUDA 10.0, cuDNN 7.4.2, Nvidia driver 440.64, Tensorflow GPU 1.15

1 Ответ

0 голосов
/ 21 марта 2020

Похоже, что были некоторые проблемы с RTX-картами, мне пришлось добавить несколько строк кода, чтобы он заработал

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
tf.Session(config=config)
...