Пределы определены в Приложении G последних руководств по программированию, но ответ может быть 512 или 1024 потоков на блок всего , в зависимости от того, есть ли у вас карта Fermi или более старая карта.
Итак, для Fermi
blockDim.x * blockDim.y * blockDim.z <= 1024
и для GT200 / G90 / G80 / Ion:
blockDim.x * blockDim.y * blockDim.z <= 512
Обратите внимание на другие ограничения ресурсов (общая память и регистры), которыеможет потребоваться, чтобы размеры блоков были меньше пределов, в зависимости от сложности кода.Это также обсуждается довольно подробно в руководстве по программированию.