Я работаю удаленно над некоторой программой CUDA в среде Linux. Поскольку существуют проблемы с переадресацией X, я не могу использовать CUDA Visual Profiler, и вместо этого мне придется использовать профилировщик командной строки CUDA.
Проблема в том, что он не распознает некоторые основные счетчики, которым я хочу следовать. Например, запустить программу с помощью следующей команды
COMPUTE_PROFILE=1 COMPUTE_PROFILE_CSV=0 COMPUTE_PROFILE_LOG=log \
CUDA_PROFILE_CONFIG=Config.txt ./my_program
С файлом Config.txt:
warp_serialize
shared_replay_overhead
Результаты в следующем журнале:
NV_Warning: Ignoring the invalid profiler config option: warp_serialize
NV_Warning: Ignoring the invalid profiler config option: shared_replay_overhead
CUDA_PROFILE_LOG_VERSION 2.0
CUDA_DEVICE 0 GeForce GTX 580
CUDA_CONTEXT 1
TIMESTAMPFACTOR fffff6c8b2653dd8
...
Характеристики моей среды:
Card: GeForce GTX 580
CUDA Driver Version / Runtime Version: 4.1 / 4.1
CUDA Capability Major/Minor version number: 2.0
Есть идеи, что я могу делать не так?