Как профилировать количество глобальных транзакций памяти для ядер cuda? - PullRequest
1 голос
/ 22 марта 2012

Как включить профилирование для счетчика "uncached_global_load_transaction" в профилировщике командной строки cuda?

1 Ответ

2 голосов
/ 23 марта 2012

Профилировщик командной строки управляется с помощью следующих переменных среды -

COMPUTE_PROFILE: is set to either 1 or 0 (or unset) to enable or disable profiling.
COMPUTE_PROFILE_CONFIG: is used to specify a config file for enabling performance counters in the GPU and various other options.
COMPUTE_PROFILE_LOG: is set to the desired file path for profiling output.

В вашем случае вы можете установить вышеупомянутые переменные среды как -

COMPUTE_PROFILE=1
COMPUTE_PROFILE_CONFIG=config.txt
COMPUTE_PROFILE_LOG=profiler_output.txt

config.txt должен содержать запись uncached_global_load_transaction.

...