На устройстве с возможностью вычислений <= 7.2 я всегда использую </p>
nvprof --events shared_st_bank_conflict
, но когда я запускаю его на RTX2080ti с CUDA10, он возвращает
Warning: Skipping profiling on device 0 since profiling is not supported on devices with compute capability greater than 7.2
Итак, как я могу определить, есть ли конфликт между банками общей памяти на этих устройствах?
Я установил Nvidia Nsight Systems и Nsight Compute, не нашел такого отчета профилирования ...
Thks