Я использовал тот же график, что и прилагается, для другого вопроса. Видно, что максимальная пропускная способность составляет более 5,5 ГБ / с. Я использую программу тестирования пропускной способности NVidia из примеров кода, чтобы найти пропускную способность между хостом и устройством и наоборот.
Система состоит из 12 процессоров Intel Westmere на двух разъемах, 4 графических процессоров Tesla C2050 с 4 слотами PCIe Gen2 Express. Теперь вопрос в том, что, поскольку пиковая пропускная способность PCIe x16 Gen2 составляет 4 ГБ / с в одном направлении, почему я получаю гораздо большую пропускную способность при передаче данных с хоста на устройство? 
Я имею в виду, что каждый PCIe подключен к ЦПУ через концентратор контроллера ввода-вывода, который через QPI (намного больше ч / б) подключен к ЦП.