CUDA: различия между пропускной способностью HtoD и DtoH - PullRequest
2 голосов
/ 11 августа 2011

Еще один вопрос, связанный с пропускной способностью.Я ожидал, что графики пропускной способности устройства к хосту и хост-устройства будут похожими, но я вижу, что между ними есть существенная разница.Учитывая, что оба следуют по одному и тому же маршруту, эффективная полоса пропускания должна быть одинаковой, не так ли?Испытательный стенд состоит из 12 процессоров Intel Westmere на двух разъемах, 4 графических процессоров Tesla C2050 с 4 слотами PCIe Gen2 Express.Использование программы bandwidthtest из примеров кода NVidia.enter image description here

Каковы затраты на создание cudamemCpy с хоста против устройства?

1 Ответ

2 голосов
/ 12 августа 2011

Во-первых, я бы сказал, что эти две кривые похожи. Я могу честно сказать, что я никогда не видел симметричную пропускную способность PCI-e ни в одной из используемых мной систем - и она включает в себя тесты CUDA и графики (OpenGL / D3D), поэтому я не думаю, что это что-то (особенно это небольшое различие) ) это должно касаться вас.

Как и в случае с другим вопросом о пропускной способности PCI-e, ответ аналогичен - драйвер может использовать разные стратегии для разных типов и размеров передачи, пытаясь получить максимально возможную пропускную способность.

Фактическая пропускная способность зависит от многих факторов, включая тип графического процессора и , особенно от используемого хост-чипсета.

...