Вы можете измерить GFLOP, запустив алгоритм с большим входом и измерив время выполнения. Затем поместите время выполнения и размер матрицы в эту формулу. Для размеров матрицы, достаточно больших, чтобы вся машина была занята, FLOP слабо зависит от размера матрицы.
Алгоритм умножения матриц GPU выполняет столько же операций с плавающей запятой, что и простой алгоритм.
for (i = 0; i < MatrixSize; i++)
for (j = 0; j < MatrixSize; j++)
for (k = 0; k < MatrixSize; k++)
C[j][i] += A[j][k] * B[k][i];
В теле цикла есть 2 операции с плавающей точкой и MatrixSize * MatrixSize * MatrixSize
итераций тела цикла, что дает формулу для NumOps. GFLOP - это просто количество операций в секунду, деленное на 10 ^ 9 («гига»).