Я использую PyCuda для запуска ядра, которое, как ожидается, займет не менее двух часов для завершения, но не работает примерно через час с простой ошибкой:
pycuda._driver.Error: cuCtxSynchronize failed: unknown error
Я использую Windows, и я добавил раздел реестра TdrDelay и установил его равным 120000000, чтобы гарантировать, что Windows не синхронизирует мое ядро.
Эта ошибка не возникает, когда я настраиваю параметрыядро, поэтому оно должно завершиться примерно через 30 минутПочему может произойти сбой вызова синхронизации после долгого запуска ядра?
Может ли моя видеокарта перегреваться и преждевременно завершать работу ядра?Может ли быть параметр CUDA, который завершает работу ядра, если оно выполняется слишком долго?Может ли запуск ядра в NVidia Visual Profiler помочь выяснить, в чем может быть проблема?