Чтобы использовать несколько графических процессоров из одного потока, вы можете переключаться между контекстами cuda (каждый из которых связан с графическим процессором) и запускать ядра асинхронно.По сути, вы будете таким образом запускать несколько ядер на нескольких графических процессорах.
Однако, если у вас есть карты с вычислительной способностью> 2.0, вы также можете запускать ядра одновременно, как показано в комментариях выше.Вы можете найти пост о одновременном выполнении ядра здесь .
Конечно, вы можете использовать обе, если у вас есть несколько карт с возможностью вычисления> = 2.0.