Ядро Cuda, которое вычисляет ? (1, ?) = среднее (? (:, ?)) + среднее (? (:, ?)):
__global__ void meanKernel(float *c,float *a, float *b)
{
int col = blockIdx.x* blockDim.x + threadIdx.x;
float sum = 0;
if (col<N)
{
for (int i=0; i<N; i++){
sum += a[i*5+col] + b[i*5+col];
c[col] = sum/5;
}
}
}