как я могу выполнить элементарную операцию с общей памятью?
у меня есть что-то похожее на это:
__shared__ int a[10];
//set a
if(tid<5)
a[2]++;
поэтому 5 потоков увеличиваются. как я могу это сделать?
я знаю, что таким образом я сериализирую выполнение 5 потоков, но как это влияет на деформацию? будут ли сериализованы все потоки в варпе или только первые 5?