Эффективная пропускная способность в Гбит / с = ((Br + Bw) / 10 ^ 9) / Время
Br = количество байтов, прочитанных ядром из DRAM
Bw = количество байтов, записанных ядром в DRAM
Время = время, затраченное ядром.
Например, вы тестируетеэффективная пропускная способность копирования матрицы с плавающей запятой 2048x2048 (по 4 байта каждая) из одного места в другое в DRAM GPU.Формула будет выглядеть следующим образом:
Пропускная способность в ГБ / с = ((2048x2048 x 4 x 2) / 10 ^ 9) / по времени, занятое ядром
здесь:
2048x2048 (матричные элементы)
4 (каждый элемент имеет 4 байта)
2 (один для чтения и один для записи)
/ 10 ^ 9 для преобразования B в ГБ.