Я пытаюсь использовать CUDA Computeprof (CUDA profiler) для профилирования многопоточного приложения.
У меня есть два потока, реализованных с помощью Qt, каждый из которых использует свой контекст CUDA.Я использую API драйвера CUDA.Приложение профилировщика обнаруживает вызовы CUDA только из первого (основного) потока и полностью игнорирует вызовы из другого потока.
У кого-нибудь есть обходной путь или причина для этого?