CUDA: пропускная способность хост-устройства больше, чем пиковое ч / б PCIe? - PullRequest
4 голосов
/ 11 августа 2011

Я использовал тот же график, что и прилагается, для другого вопроса. Видно, что максимальная пропускная способность составляет более 5,5 ГБ / с. Я использую программу тестирования пропускной способности NVidia из примеров кода, чтобы найти пропускную способность между хостом и устройством и наоборот. Система состоит из 12 процессоров Intel Westmere на двух разъемах, 4 графических процессоров Tesla C2050 с 4 слотами PCIe Gen2 Express. Теперь вопрос в том, что, поскольку пиковая пропускная способность PCIe x16 Gen2 составляет 4 ГБ / с в одном направлении, почему я получаю гораздо большую пропускную способность при передаче данных с хоста на устройство? enter image description here

Я имею в виду, что каждый PCIe подключен к ЦПУ через концентратор контроллера ввода-вывода, который через QPI (намного больше ч / б) подключен к ЦП.

1 Ответ

6 голосов
/ 11 августа 2011

Пиковая пропускная способность PCIe x16 Gen2 составляет 8 ГБ / с в каждое направление. Вы не превышаете пик.

...