Функция синхронизации CUDA завершается с ошибкой во время работы ядра - PullRequest
0 голосов
/ 16 мая 2018

Я использую PyCuda для запуска ядра, которое, как ожидается, займет не менее двух часов для завершения, но не работает примерно через час с простой ошибкой:

pycuda._driver.Error: cuCtxSynchronize failed: unknown error

Я использую Windows, и я добавил раздел реестра TdrDelay и установил его равным 120000000, чтобы гарантировать, что Windows не синхронизирует мое ядро.

Эта ошибка не возникает, когда я настраиваю параметрыядро, поэтому оно должно завершиться примерно через 30 минутПочему может произойти сбой вызова синхронизации после долгого запуска ядра?

Может ли моя видеокарта перегреваться и преждевременно завершать работу ядра?Может ли быть параметр CUDA, который завершает работу ядра, если оно выполняется слишком долго?Может ли запуск ядра в NVidia Visual Profiler помочь выяснить, в чем может быть проблема?

1 Ответ

0 голосов
/ 17 мая 2018

Мне удалось завершить работу моего долго работающего ядра без ошибок, добавив ключ реестра "TdrLevel" вместе с "TdrDelay" и установив его значение равным 0.

...