опция компилятора: -Xptxas –dlcm = cg не имеет никакого эффекта - PullRequest
0 голосов
/ 20 октября 2019

Мой код включает в себя операции с разреженными матрицами, и я хочу использовать только L2-кэш, чтобы предотвратить сбои. Для этого я использовал опцию компилятора: -Xptxas –dlcm=cg (как показано на рисунке). Но анализ с использованием Nsight не показывает влияния этой опции на частоту обращений в кэш L1 и L2. в чем дело? мой графический процессор имеет архитектуру maxwell. я не пользуюсь какой-либо библиотекой, и мое приложение представляет собой трехдиагональный матричный алгоритм (алгоритм Томаса). Также я использую флаг cuda arch: compute_50, sm_50. правильно ли я использовал флаг? Есть ли какие-либо дополнительные настройки, которые я должен изменить?

enter image description here

...