CEMA memset в Compute Visual Profiler - PullRequest
       5

CEMA memset в Compute Visual Profiler

0 голосов
/ 10 марта 2012

Я использую Compute Visual Profiler для измерения производительности моих программ CUDA.

Результат профилировщика показывает 2 разных результата для функции cudaMemset.

  1. memset32_post
  2. memset128

Я хочу знать, в чем разница между этими 2?

Screenshot

1 Ответ

1 голос
/ 11 марта 2012

Я думаю, что ядро ​​memset128 выполняет большую часть работы, а ядро ​​memset32_post очищает остаток, так как вы использовали размер, не кратный 128.

Не о чем беспокоиться, просто я пытаюсь реализовать memset наиболее эффективным способом, хотя я бы старался избегать memset во внутреннем цикле (на любом процессоре). Если вы действительно беспокоитесь об этом, вы можете перерасходовать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...