Я ищу очень простой пример умножения матрицы костей для CUBLAS, который может умножить M на N и поместить результаты в P для следующего кода, используя высокопроизводительные операции с графическим процессором:
float M[500][500], N[500][500], P[500][500];
for(int i = 0; i < Width; i++){
for(int j = 0; j < Width; j++)
{
M[i][j] = 500;
N[i][j] = 500;
P[i][j] = 0;
}
}
До сих пор большая часть кода, который я нахожу для выполнения любого вида умножения матриц с использованием CUBLAS (кажется?) Чрезмерно сложна.
Я пытаюсь создать базовую лабораторию, где студенты могут сравнивать производительность умножения матриц наGPU против матричного умножения на CPU, предположительно с повышенной производительностью на GPU.