CUDA computeprof не работает с многопоточностью - PullRequest
2 голосов
/ 27 января 2012

Я пытаюсь использовать CUDA Computeprof (CUDA profiler) для профилирования многопоточного приложения.

У меня есть два потока, реализованных с помощью Qt, каждый из которых использует свой контекст CUDA.Я использую API драйвера CUDA.Приложение профилировщика обнаруживает вызовы CUDA только из первого (основного) потока и полностью игнорирует вызовы из другого потока.

У кого-нибудь есть обходной путь или причина для этого?

1 Ответ

1 голос
/ 27 января 2012

Я обычно использую Nvidia Parallel Nsight для профилирования многопоточных приложений.Но я протестировал CUDA-профилировщик на примере MonteCarloMultiGPU SDK 3.2, и он действительно профилирует весь контекст CUDA для одного сеанса.Я использую профилировщик CUDA, поставляемый с CUDA 4.0.

...