У меня есть проект CUDA.Он состоит из нескольких файлов .cpp, которые содержат логику моего приложения, и одного файла .cu, который содержит несколько ядер, плюс функцию __host__
, которая их вызывает.
Теперь я хотел бы определить количество регистров, используемых моимядро (s).Мой обычный вызов компилятора выглядит так:
nvcc -arch compute_20 -link src/kernel.cu obj/..obj obj/..obj .. -o bin/..exe -l glew32 ..
.
Добавление флага компилятора "-Xptxas –v" к этому вызову, к сожалению, не имеет никакого эффекта.Компилятор по-прежнему выдает тот же текстовый вывод, что и раньше.Скомпилированный .exe также работает так же, как и раньше, с одним исключением: моя частота кадров увеличивается до 1800 кадров в секунду, вместо 80 кадров в секунду.