Я знаю о существовании nvvp
и nvprof
, конечно, но по разным причинам nvprof
не хочет работать с моим приложением, которое использует много общих библиотек.nvidia-smi
может подключиться к драйверу, чтобы выяснить, что работает, но я не могу найти хороший способ заставить nvprof
присоединиться к запущенному процессу.
Есть флаг --profile-all-processes
, который действительно даетмне сообщение «NVPROF профилирует процесс 12345», но больше ничего не печатает.Я использую CUDA 8.
Как я могу получить подробную разбивку производительности моих ядер CUDA в этой ситуации?