Какая скорость загрузки текстуры? - PullRequest
3 голосов
/ 11 мая 2011

Я хотел бы загрузить два изображения в память графического процессора, и мне интересно, как быстро я смогу это сделать?

На самом деле - будет ли быстрее сравнивать два растровых изображения в оперативной памяти с процессором или загружать их в графический процессор и использовать для этого параллелизм графического процессора?

Ответы [ 3 ]

2 голосов
/ 11 мая 2011

Если вы запустите образец пропускной способности устройства CUDA, вы получите эталон скорости загрузки.

Если предположить, что трехканальная память ОЗУ DDR3 1600 МГц, вы получите пропускную способность памяти около 38 ГБ / с.

Возьмите типичную карту среднего уровня, такую ​​как GTX460, и вы получите что-то вроде пропускной способности памяти 84 ГБ / с. Обратите внимание, что вам нужно будет прыгнуть через шину, что-то вроде теоретического 8 ГБ / с, ~ 5,5 на практике для канала PCI-E2.0 x16.

Обратите внимание, что ответ Котлински не совсем правильный. Вы можете выполнить сравнение параллельно, а затем выполнить параллельное уменьшение, и в этом случае большая пропускная способность устройства с графическим процессором может в конечном итоге выиграть.

Я думаю, что ответ, вероятно, будет: потеря загрузки в GPU и сравнение один раз. Возможный выигрыш, если сравнение производится несколько раз (например, сохраняется и изменяется на графическом процессоре).

Edit:

Сравнение нескольких раз относится к случаям, когда вы модифицировали изображения в памяти графического процессора на месте. Таким образом, это заслуживает другого сравнения (кеширование не обрезает его), не влечет за собой наказание другой копии через шину.

1 голос
/ 11 мая 2011

Поскольку доступ к памяти является узким местом, весьма вероятно, что это быстрее сделать в ЦП.Выполнение его параллельно не даст вам ничего, доступ к памяти по сути является последовательной операцией.

0 голосов
/ 11 мая 2011

Ответ на этот вопрос весьма спорен и полностью зависит от конфигурации вашей системы.Это означает, что вам придется делать тесты самостоятельно.Факторы, которые могут повлиять на вашу ситуацию:

  1. Скорость вашей оперативной памяти
  2. Скорость шины графического процессора
  3. Независимо от того, разделяете ли вы ОЗУ между GPU и CPU

Однако я думаю, что в общем случае (например, с частотой передачи данных порядка порядка ГБ / с) загрузка изображений в графический процессор быстрее и сравнение там различий.

...