Поскольку ответ еще не принят, я предлагаю попробовать новейшую версию Visual Profiler.
Новый NVIDIA Visual Profiler (v4.1) поддерживает автоматический анализ производительности для определения возможностей повышения производительности в вашем приложении. Он также напрямую ссылается на наиболее полезные разделы Руководства по передовому опыту для выявления проблем, которые он обнаруживает. Visual Profiler по-прежнему доступен бесплатно как часть набора инструментов CUDA на веб-сайте разработчика NVIDIA: http://www.nvidia.com/getcuda.
Если вы все еще не можете заставить его работать, пожалуйста, сообщите об ошибке через вашу (бесплатную) зарегистрированную учетную запись разработчика NVIDIA, чтобы команда, работающая над Visual Profiler, могла продолжить расследование.