Я новичок в CUDA, и я хочу реализовать сумму умножения в этом уравнении
Я написал этот код в CUDA, но он не дает правильного ответа
mulFV1[idx] = f[idx][idy]*compV2[idy];
mulFV2[idy] = f[idx][idy]*compV1[idx];
и затем я посылаю массивы mulFV1 и mulFV2 в функцию редуктора ..
Вопрос в том, как его отладить?
Примечание: наличие в изображении mulFV1 относится к строкам, а беспокойство к mulFV2 к столбцам