NVIDIA поставляет двоичные утилиты, которые могут отображать заголовки и разбирать двоичные полезные данные в объектных файлах, библиотеках и исполняемых файлах.cudaobjdump
можно использовать следующим образом:
$ nvcc -arch=sm_62 -std=c++11 -I ./ main.cu -o main
$ cuobjdump ./main
Fatbin elf code:
================
arch = sm_62
code version = [1,7]
producer = <unknown>
host = linux
compile_size = 64bit
Fatbin elf code:
================
arch = sm_62
code version = [1,7]
producer = cuda
host = linux
compile_size = 64bit
Fatbin ptx code:
================
arch = sm_62
code version = [5,0]
producer = cuda
host = linux
compile_size = 64bit
compressed
, который показывает двоичные данные и полезную нагрузку PTX, включенные в исполняемый файл.