Мое ядро широко использует регистры.
При компиляции для 1.2 устройств --ptxas-options=-v
сообщает о 83 регистрах.Когда я пытаюсь скомпилировать для 2.0, используется только 63 регистра, остальные локальные данные помещаются в локальную память.Эксперименты с параметром --maxrregcount дают ограничение в 124 регистра на поток для 1.2 устройств и всего 63 регистра для 2.0.
Можно ли поместить все данные в регистры на архитектуре 2.0?