Я запускаю nvprof.exe для функции, которая инициализирует данные, вызывает три ядра и данные free....
Я столкнулся с проблемой, пытаясь проанализировать мои ядра. У меня есть симулятор частиц, и CUDA...
Я использую nvprof, чтобы связать мое приложение cuda с командой nvprof -f -o nvvp.log --log-file...
Я пытаюсь использовать nvprof для мониторинга производительности графического процессора. Я хотел...
Я пытаюсь профилировать свою программу CUDA, используя инструмент nvprof. Вот мой код: #include...
Я пытаюсь предварительно извлечь некоторые данные.Обычно для этого я полагаюсь на компилятор, так...
Есть ли способ заставить CUDA nvprof включать вызовы функций, такие как malloc, в свой...
Как обойти ошибку nvprof, возникающую при запуске на диске с относительно небольшим доступным...
Я хочу создать линейный график, который может отражать использование и использование памяти...
Каково определение начала и конца запуска ядра в CPU и GPU (желтый блок)?Где граница между ними?...
Для некоторых профилей приложений CUDA я вижу, что значение локального коэффициента попадания...
Согласно определению flop_sp_efficiency Соотношение достигнутых и максимальных операций с плавающей...
В чем разница между «действиями графического процессора» и «вызовами API» в результатах «nvprof»? Я...
Моя программа представляет собой конвейер, который содержит несколько ядер и memcpys. Каждая задача...
Я профилирую ядро CUDA, используя nvprof с включенной выборкой ПК, чтобы понять, какие у меня...
Мне интересен способ измерения детальной производительности пользовательского Tensorflow Op при...