Почему профилировщик командной строки CUDA не распознает некоторые счетчики? - PullRequest
1 голос
/ 26 февраля 2012

Я работаю удаленно над некоторой программой CUDA в среде Linux. Поскольку существуют проблемы с переадресацией X, я не могу использовать CUDA Visual Profiler, и вместо этого мне придется использовать профилировщик командной строки CUDA.

Проблема в том, что он не распознает некоторые основные счетчики, которым я хочу следовать. Например, запустить программу с помощью следующей команды

COMPUTE_PROFILE=1 COMPUTE_PROFILE_CSV=0 COMPUTE_PROFILE_LOG=log  \
CUDA_PROFILE_CONFIG=Config.txt ./my_program

С файлом Config.txt:

warp_serialize
shared_replay_overhead

Результаты в следующем журнале:

NV_Warning: Ignoring the invalid profiler config option: warp_serialize
NV_Warning: Ignoring the invalid profiler config option: shared_replay_overhead
CUDA_PROFILE_LOG_VERSION 2.0
CUDA_DEVICE 0 GeForce GTX 580
CUDA_CONTEXT 1
TIMESTAMPFACTOR fffff6c8b2653dd8

...

Характеристики моей среды:

Card: GeForce GTX 580
CUDA Driver Version / Runtime Version:          4.1 / 4.1
CUDA Capability Major/Minor version number:    2.0

Есть идеи, что я могу делать не так?

1 Ответ

2 голосов
/ 27 февраля 2012

Счетчик warp_serialize не поддерживается для устройств с вычислительной возможностью 2.x . См. Таблицу 6. Типы счетчиков Profiler в Compute Visual Profiler. Руководство пользователя.

По поводу shared_replay_overhead Я не нашел ничего связанного с ним.

...