У меня есть пара совместимых с Parallel Nsight графических процессоров CUDA.Второй (нижний) подключен к моему монитору, а первый (верхний) настроен как ускоритель PhysX.Вы можете ясно увидеть мою конфигурацию ниже.
Теперь, чтобы выполнить отладку CUDA с помощью Nsight, мне нужно только запускать код ядра на графическом процессоре, не подключенном к монитору.Мой компьютер уже настроен на "отладку без головы".Также ниже приведен базовый пример кода, который я хочу выполнить на другом графическом процессоре:
// KernelCall.cu
#include <iostream>
#include "cuda.h"
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
__global__ void kernel(void){}
int main()
{
kernel<<<1,1>>>();
system("pause");
return 0;
}
Мой вопрос в основном, что мне нужно вставить в этот код, чтобы он выполнялся только на другом устройстве и позволялмне выполнить отладку CUDA?
![NVIDIA Control Panel](https://i.stack.imgur.com/sSDg1.png)