Ядра, которые быстро работают на Multicores, но относительно медленно на GPU - PullRequest
1 голос
/ 15 декабря 2011

Может кто-нибудь предложить список алгоритмов, в которых Multicores дают превосходную производительность по сравнению с графическими процессорами? Я знаю, что гибридный подход все еще будет быстрее, но что я действительно ищу, так это понять области, в которых GPU все еще отстает от многоядерных.

Ответы [ 2 ]

3 голосов
/ 16 декабря 2011

В порядке соответствия от наименее подходящего к наиболее подходящему:

  • Графические процессоры могут ускорять только рабочие нагрузки типа SIMD, поэтому они не годятся для параллельных задач (например, make -jN).
  • Графические процессоры не имеют большого объема кэша, и их атомарные операции относительно медленны по сравнению с процессорами;поэтому они далеко не так хороши, как ЦП со структурами на основе указателей, таких как деревья.
  • Рабочие нагрузки, такие как обработка изображений или компьютерное зрение, находятся в серой области, где преимущества графического процессора (оборудование для наложения текстур, больше ядер) могуткомпенсировать преимущества процессора (лучшая поддержка целочисленных SIMD, гораздо более высокая тактовая частота).Если фактическая обработка выполняется с плавающей запятой, это, вероятно, промывка или небольшое преимущество для GPU;если обработка выполняется в целочисленном виде и может быть отображена на инструкции SSE2, ЦП сокрушит графический процессор.

Графические процессоры превосходно справляются с параллельными данными рабочими нагрузками, которые используют много плавающей запятой одинарной точности.

Любая рабочая нагрузка, выгружаемая в графический процессор, также сопряжена с расходами на передачу данных.

0 голосов
/ 07 января 2013

Некоторые ребята из Intel провели некоторые исследования, где сравнивали научные вычисления на современных многоядерных процессорах и графических процессорах.Может быть, вы найдете это интересным.Результаты показаны на рис. 1 на стр. 5.

Ли и др. «Разоблачение мифа о 100X GPU и CPU: оценка пропускной способности вычислений на CPU и GPU»: http://www.hwsw.hu/kepek/hirek/2010/06/p451-lee.pdf

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...