Как я могу прочитать двоичный файл CUDA .cubin в Linux? - PullRequest
1 голос
/ 02 ноября 2010

Я пытаюсь получить количество регистров на поток для каждого из моих ядер в моей программе CUDA. Это поможет мне использовать калькулятор занятости CUDA (http://developer.download.nvidia.com/compute/cuda/CUDA_Occupancy_calculator.xls), чтобы определить наибольшую загруженность графического процессора для моей программы.

Однако я сгенерировал файл .cubin, используя флаг -cubin, но не могу прочитать его в vim / othertexteditors, как рекомендует NVIDIA (http://forums.nvidia.com/index.php?showtopic=31279). Кто-нибудь знает, как его прочитать?

Спасибо

1 Ответ

4 голосов
/ 03 ноября 2010

Самое простое решение - передать -Xptxas -v в nvcc примерно так

$ nvcc -Xptxas -v foo.cu
ptxas info    : Compiling entry function '_Z9my_kernelPfS_f' for 'sm_10'
ptxas info    : Used 2 registers, 20+16 bytes smem

В качестве альтернативы, вы можете использовать API-функцию cudaFuncGetAttributes для получения необходимых значений вво время выполнения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...