Для оптимизации, программа работает нормально. Единственной проблемой было слишком большое отклонение прошедшего времени в ядре (~ 50%) от запуска к запуску.
Это, вероятно, вызвано пакетированием вычислительных команд драйвером WDDM. Если вы будете искать вокруг, вы найдете некоторые предложения, которые можно попытаться свести к минимуму его отрицательное влияние.
Я искал способы получить ядра CUDA в монопольном режиме, чтобы получить более стабильный результат.
Этот тип режима работы существует только для Tesla и некоторых графических процессоров Quadro, использующих режим TCC в Windows. Ваш графический процессор не может быть использован таким образом.
Я неправильно понимаю этот параметр на панели управления?
Да. Цитирование из документации:
Windows 10, Maxwell GPUs and later.
Offers significant improvement for some Compute applications.
Care should be taken when turning this setting ON, as there can
be unpredictable effects with some applications and graphics features.
Давая это предупреждение, безопаснее всего оставить эту настройку выключенной.