У меня есть несколько ядер CUDA, которые я хочу запустить в отдельных потоках.
Мне нужно, чтобы каждый pthread выполнял, скажем, 3 ядра cuda, и они должны выполняться последовательно.
Я подумал, что попытаюсь передать каждому pthread ссылку на поток, и поэтому каждое из этих трех ядер cuda будет выполняться последовательно в одном потоке.
Я мог бы заставить это работать с другим контекстом для pthread, который затем выполнял бы ядра в обычном режиме, но это, похоже, потребовало бы много времени.
Так как мне заставить каждую pthread работать в одном контексте одновременно с другими pthreads?
Спасибо