Максимальное количество регистров CUDA на поток: sm_12 против sm_20 - PullRequest
0 голосов
/ 19 мая 2011

Мое ядро ​​широко использует регистры.

При компиляции для 1.2 устройств --ptxas-options=-v сообщает о 83 регистрах.Когда я пытаюсь скомпилировать для 2.0, используется только 63 регистра, остальные локальные данные помещаются в локальную память.Эксперименты с параметром --maxrregcount дают ограничение в 124 регистра на поток для 1.2 устройств и всего 63 регистра для 2.0.

Можно ли поместить все данные в регистры на архитектуре 2.0?

1 Ответ

2 голосов
/ 19 мая 2011

К сожалению, предел регистров для каждого потока для возможности вычислений 2.x карт составляет 63 регистра на поток. Нет никакого способа остановить утечку локальной памяти, если у вас очень сложное ядро, которое потребляет много регистров.

...