У меня четыре графических процессора RTX2080, и я хочу включить равноправный доступ с устройства 1 на устройство 0 в следующем коде.
cudaSetDevice(0);
float* data;
cudaMalloc(&data, 1000 * sizeof(float));
cudaSetDevice(1);
cudaDeviceEnablePeerAccess(0, 0); // This will fail with error: cudaErrorPeerAccessUnsupported
Я проверил unifiedAddressing
из cudaDeviceProp
и значение равно 1. Что-то не так с моим кодом?
Вот топология моего подключения к графическому процессору:
GPU0 GPU1 GPU2 GPU3
GPU0 X NODE SYS SYS
GPU1 NODE X SYS SYS
GPU2 SYS SYS X NODE
GPU3 SYS SYS NODE X
Версия драйвера: 430.40
Версия CUDA: 10.1