Теоретическая пропускная способность может быть рассчитана с использованием спецификации оборудования.
Например, NVIDIA GeForce GTX 280 использует оперативную память DDR с тактовой частотой памяти 1107 МГц и интерфейсом памяти шириной 512 бит.Используя эти элементы данных, максимальная теоретическая пропускная способность памяти NVIDIA GeForce GTX 280 составляет 141,6 ГБ / с:
В этом расчете тактовая частота памяти преобразуется в Гцумножается на ширину интерфейса (делится на 8, чтобы преобразовать биты в байты) и умножается на 2 из-за двойной скорости передачи данных.Наконец, этот продукт делится на 109, чтобы преобразовать результат в ГБ / с (Гбит / с).
Эффективная пропускная способность рассчитывается по времени выполнения определенных действий программы и по тому, как программа получает доступ к данным.Для этого используйте следующее уравнение:
Эффективная пропускная способность = ((Br + Bw) / 109) / время
Здесь эффективная пропускная способность указывается в единицах Гбит / с, Br - это количество байтов, прочитанных на ядро, Bw - количество байтов, записанных на ядро, и время дается в секундах.
Более подробная информация доступна в Руководстве по лучшей практике CUDA.