CUDA 4.0 значительно упростила управление одним контекстом CUDA из нескольких потоков - просто вызовите cudaSetDevice (), чтобы указать, какому устройству CUDA вы хотите, чтобы поток отправлял команды.
Обратите внимание, что это, вероятно, будет менее эффективно, чем управление контекстом CUDA из одного потока - если потоки ЦП не выполняют другую работу, чтобы держать их занятыми между запусками ядра, они, вероятно, будут сериализованы мьютексами, которые CUDA использует внутренне сохранять согласованность структур данных.