У меня есть ядро, которое запускается дважды с разным размером сетки.
Моя проблема с cuPrintf.Когда у меня нет cudaPrintfInit()
до запуска ядра и cudaPrintfDisplay(stdout, true)
и cudaPrintfEnd()
после запуска ядра, у меня нет ошибки, но когда я их туда помещаю, я получаю ошибку «неопределенная ошибка запуска».
В коде моего устройства есть только один цикл для печати:
if (threadIdx.x==0) {
cuPrintf("MAX:%f x:%d y:%d\n", maxVal, blockIdx.x, blockIdx.y);
}
Я использую CUDA 4.0 с картой с поддержкой cuda 2.0 и собираю свойкод с этим синтаксисом:
nvcc LB2.0.cu -arch=compute_20 -code=sm_20