Есть ли способ выполнить инструкцию внутри кода устройства, не вызывая ошибку CUDA? Что-то выглядит следующим образом:
__global__ void myKernel(float* X1, float* X2, float* Y){
try{
Y[0] = X1[0] / X2[0];
}catch(){
Y[0] = 0.0f;
}
}
Я знаю, что мы можем проверить значение X2 [0] до деления, но что если я хочу выполнить инструкцию без проверки на допустимые входные данные и выполнить ее безопасно ?