Проблема с Tensorflow-gpu (ошибка времени выполнения CUDA: недопустимый образ ядра устройства) - PullRequest
2 голосов
/ 03 августа 2020

У меня есть виртуальная среда python (conda), в которой я установил набор инструментов CUDA 10.1.243 и tensorflow-gpu 2.3.0rc0. Мой драйвер CUDA - 11.0.

Чтобы проверить, правильно ли был установлен тензорный поток на GPU, я выполнил серию команд из venv:

tf.test.is_built_with_cuda()

Истина

tf.config.list_physical_devices(‘GPU’)

Найдено устройство 0 со свойствами: pciBusID: 0000: 01: 00.0 имя: Quadro M2000M computeCapability: 5.0 [PhysicalDevice (name = '/ physical_device: GPU: 0', device_type = 'GPU')]

python -c "import tensorflow as tf; print(tf.reduce_sum(tf.random.normal([1000,1000])))"

tenorflow. python .framework.errors_impl.InternalError: Неявная инициализация среды выполнения CUDA на GPU: 0 не удалось. Статус: образ ядра устройства недействителен

Я не знаю, как это исправить. У меня есть ощущение, что это связано с изменением компиляции таким образом, что tenorflow поддерживает вычислительные возможности моего устройства (5.0), но я не уверен, как действовать дальше. Спасибо !!

Ответы [ 2 ]

1 голос
/ 30 августа 2020

Согласно объяснению этого вопроса на github, команда инженеров Google Tensorflow уже отказалась от поддержки графических процессоров некоторых более старых версий: https://github.com/tensorflow/tensorflow/issues/41990

Я считаю, что ваш графический процессор относится к семейству графических процессоров более низких версий. . Итак, понижение версии TF с 2.3. до 2.2 является решением. И инженеры TF предлагают нам собрать TF2.3 самостоятельно и изменить его сценарии конфигурации сборки, чтобы включить поддержку графических процессоров более низких версий, но команда Google TF не подтверждает, что это может работать, и нет возможности исправить любую проблему, с которой мы столкнемся. .

1 голос
/ 04 августа 2020

У меня была такая же проблема. Я понизил версию Tensorflow2.3 до 2.2 с помощью следующей команды.

pip install --upgrade tensorflow==2.2

Сейчас он работает, но очень медленно.

...