cuda: эффективная пропускная способность в примере SDK Сокращение - PullRequest
0 голосов
/ 14 июля 2011

в файле extension.pdf, он представляет метод сокращения через 7 шагов, имеется 16777216 элементов, на 1-м шаге эффективная пропускная способность составляет 2,083 ГБ / с, как получается 2,083 ГБ / с?а как получается 2-й шаг пропускной способности 4.854Гб / с?

1 Ответ

2 голосов
/ 14 июля 2011

Значения пропускной способности рассчитываются с использованием числа байтов во входных данных сокращения, разделенных на время выполнения (обратите внимание, что 2 ^ 22 целых числа = 16777216 байтов). Расчет ясно показан на странице 10 PDF-файла, который поставляется в SDK в reduction/doc.

...