Я работаю над CUDA, и у меня возникла проблема, связанная с синхронизацией потоков. В моем коде мне нужны потоки для выполнения различных частей кода, например:
one thread ->
all thread ->
one thread ->
Это то, что я хочу. В начальной части кода будет выполняться только один поток, а затем некоторая часть будет выполняться всеми потоками, затем снова один поток Также потоки выполняются в цикле. Может кто-нибудь сказать мне, как это сделать?