Вопросы с тегом nvprof - PullRequest

Вопросы с тегом nvprof

0 голосов
1 ответ
0 голосов
1 ответ

Я запускаю nvprof.exe для функции, которая инициализирует данные, вызывает три ядра и данные free....

Егор Лебедев / 03 ноября 2019
0 голосов
0 ответов

Я столкнулся с проблемой, пытаясь проанализировать мои ядра. У меня есть симулятор частиц, и CUDA...

RBaumgar / 01 ноября 2019
1 голос
0 ответов

Я использую nvprof, чтобы связать мое приложение cuda с командой nvprof -f -o nvvp.log --log-file...

whuala / 15 октября 2019
1 голос
0 ответов

Я пытаюсь использовать nvprof для мониторинга производительности графического процессора. Я хотел...

ZHANG Juenjie / 10 июля 2019
0 голосов
0 ответов

Я пытаюсь профилировать свою программу CUDA, используя инструмент nvprof. Вот мой код: #include...

PintoDoido / 01 июля 2019
0 голосов
1 ответ

Я пытаюсь предварительно извлечь некоторые данные.Обычно для этого я полагаюсь на компилятор, так...

ragerdl / 29 июня 2019
0 голосов
1 ответ

Есть ли способ заставить CUDA nvprof включать вызовы функций, такие как malloc, в свой...

ragerdl / 19 июня 2019
0 голосов
1 ответ

Как обойти ошибку nvprof, возникающую при запуске на диске с относительно небольшим доступным...

ragerdl / 31 мая 2019
0 голосов
0 ответов

Я хочу создать линейный график, который может отражать использование и использование памяти...

Js Du / 29 мая 2019
1 голос
1 ответ

Каково определение начала и конца запуска ядра в CPU и GPU (желтый блок)?Где граница между ними?...

skytree / 15 мая 2019
0 голосов
1 ответ

Для некоторых профилей приложений CUDA я вижу, что значение локального коэффициента попадания...

mahmood / 17 апреля 2019
0 голосов
2 ответов

Согласно определению flop_sp_efficiency Соотношение достигнутых и максимальных операций с плавающей...

mahmood / 11 апреля 2019
1 голос
1 ответ

В чем разница между «действиями графического процессора» и «вызовами API» в результатах «nvprof»? Я...

myabcc17 / 08 апреля 2019
0 голосов
1 ответ

Моя программа представляет собой конвейер, который содержит несколько ядер и memcpys. Каждая задача...

StrikeW / 15 января 2019
0 голосов
0 ответов

Я профилирую ядро ​​CUDA, используя nvprof с включенной выборкой ПК, чтобы понять, какие у меня...

Daniel / 23 декабря 2018
0 голосов
0 ответов

Мне интересен способ измерения детальной производительности пользовательского Tensorflow Op при...

Christoph Pohl / 04 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...