Можем ли мы использовать сложение 1D-векторов с ядром CUDA следующим образом.
a[tid] =a[tid-10] + 2;
результат параллельного ядра должен быть использован в другом ядре.Так каковы возможности для этого?