Question

Можно ли определить количество максимальных резидентных блоков на всем графическом процессоре, чтобы избежать необходимости повторного выполнения ядра в качестве глобального барьера?

Точнее, я хочу избежать затрат на копирование частичных результатов в глобальную память и затрат на выполнение ядра. Таким образом, работа будет равномерно распределена по каждому блоку, и блоки будут чередовать свои вычисления, пока один из них не найдет результат.

Большое спасибо.

keveman · Answer 1 · 19 января 2012

Эта ветка может быть вам полезна. В общем, если задача полностью параллельна, у вас нет запуска новых ядер для остальной части данных. Вместо этого вы можете просто зацикливаться внутри ядра.

Оптимизация количества блоков до максимального количества резидентных блоков на GPU

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Оптимизация количества блоков до максимального количества резидентных блоков на GPU

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов