Оптимизация количества блоков до максимального количества резидентных блоков на GPU - PullRequest
1 голос
/ 19 января 2012

Можно ли определить количество максимальных резидентных блоков на всем графическом процессоре, чтобы избежать необходимости повторного выполнения ядра в качестве глобального барьера?

Точнее, я хочу избежать затрат на копирование частичных результатов в глобальную память и затрат на выполнение ядра. Таким образом, работа будет равномерно распределена по каждому блоку, и блоки будут чередовать свои вычисления, пока один из них не найдет результат.

Большое спасибо.

1 Ответ

0 голосов
/ 19 января 2012

Эта ветка может быть вам полезна. В общем, если задача полностью параллельна, у вас нет запуска новых ядер для остальной части данных. Вместо этого вы можете просто зацикливаться внутри ядра.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...