Профилирование произвольных приложений CUDA - PullRequest
0 голосов
/ 18 мая 2018

Я знаю о существовании nvvp и nvprof, конечно, но по разным причинам nvprof не хочет работать с моим приложением, которое использует много общих библиотек.nvidia-smi может подключиться к драйверу, чтобы выяснить, что работает, но я не могу найти хороший способ заставить nvprof присоединиться к запущенному процессу.

Есть флаг --profile-all-processes, который действительно даетмне сообщение «NVPROF профилирует процесс 12345», но больше ничего не печатает.Я использую CUDA 8.

Как я могу получить подробную разбивку производительности моих ядер CUDA в этой ситуации?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...