Nsight Visual Studio Edition 2.2 предлагает следующие преимущества по сравнению с Visual Profiler:
ОБЩИЙ
Интеграция в Visual Studio 2008 SP1 и 2010 (требуется Professional Edition, поскольку VS Express Edition не поддерживает пакеты интеграции).
Локальные и удаленные сеансы анализа. Удаленные сеансы также можно настроить для копирования приложения и ресурсов в удаленную систему.
Сбор информации из целевого приложения или из дерева процессов.
Представления отчетов поддерживают более сложные группировки и фильтрацию. Таблицы данных могут быть экспортированы в Excel.
TRACE ACTIVITY
Отслеживание активности ОС, включая время жизни процесса, потока и модуля, переключение контекста потока, причины ожидания потока, использование ЦП, использование ЦП процесса и использование потока.
Сбор рабочей трассировки API и GPU для CUDA, OpenGL 2.x-3.x, DirectX 9-11 и OpenCL 1.1 и отображение всей информации на временной шкале.
Сбор трассировок стека вызовов по всем отслеживаемым вызовам API или только в том случае, если отслеживаемые вызовы API возвращают ошибки.
Программные счетчики CUDA для отображения выделенной памяти для контекста.
Дополнительный контроль над тем, какая информация отслеживается. Это очень важно, поскольку отслеживание слишком большого количества информации может привести к тому, что приложение станет связанным с ЦП.
Отображение временной шкалы и дерева для пользовательских комментариев из библиотеки расширений инструментов NVIDIA и маркеров производительности D3D.
CUDA PROFILING ACTIVITY
Профилировщик CUDA предоставляет метод для захвата вашего ядра и многократного воспроизведения его прозрачным для вашего приложения. Это позволяет собирать данные профилирования в недетерминированных приложениях и только с 1 запуском ваших приложений. Visual Profiler <= 5 требует, чтобы приложение было детерминированным, чтобы оно могло многократно перезапускать приложение. </p>
Поддерживает сбор многих полезных показателей, которые пока не поддерживаются Visual Profiler, включая допустимые отклонения, что является наиболее важным показателем для понимания, если у вас достаточно причин занятости и отклонения, чтобы помочь вам понять, что ограничивает производительность применение.
Visual Profiler имеет следующие преимущества:
Кроссплатформенная.
Предоставляет экспертную систему для просмотра собранной информации.
Ссылки в результатах на Руководство по передовой практике CUDA.
Временная шкала может отображать корреляцию между событиями CPU и GPU при нажатии на событие.
CUDA 5.0 поддерживает новый профилировщик командной строки (nvprof).
CUDA 5.0 поддерживает корреляцию источника для расхождения ветвей и доступа к памяти с неправильными шаблонами доступа.
Профилировщик CUDA 5.0 интегрирован в Nsight Eclipse Edition.
Лучшая поддержка счетчиков PM Tesla.
Visual Profiler в CUDA 5.0 добавляет ряд функций, доступных в Nsight 1.5 и 2.x, включая
Библиотека расширений NVIDIA Tools для аннотирования вашего приложения диапазонами и маркерами, которые могут отображаться на временной шкале.
Параллельная трассировка ядра на графических процессорах Fermi и Kepler.
Оба инструмента предоставят вам очень полезную информацию для анализа вашего приложения. Я рекомендую вам использовать последнюю версию каждого из инструментов.
В следующей версии Nsight VSE будет много новых функций для изучения работы вашего ядра CUDA. Для получения дополнительной информации см http://developer.download.nvidia.com/GTC/PDF/GTC2012/PresentationPDF/S0430-GTC2012-Developing-CUDA-Nsight.pdf.