Теоретически вы можете иметь 65535 блоков на размерность сетки, до 65535 * 65535 * 65535.
Мой вопрос: если вы вызываете ядро, подобное этому kernel<<< BLOCKS,THREADS >>>()
(без объектов dim3), какое максимальное количество доступно для БЛОКОВ?
В моем приложении я установил его на 192000 и, похоже, работает нормально ... Проблема в том, что используемое ядро изменяет содержимое огромного массива, поэтому, хотя я проверил некоторые части массива и, казалось, все в порядке, я не могу быть уверен, что ядро в других местах вели себя странно.
Для записи у меня 2,1 GPU, GTX 500 ti.