Конечно, но для этого требуется архитектура Kepler.
Посмотрите их последний пример классической быстрой сортировки.
http://blogs.nvidia.com/2012/09/how-tesla-k20-speeds-up-quicksort-a-familiar-comp-sci-code/
Насколько я знаю, только последний Kepler GK110 поддерживает динамический параллелизм, который допускает такой рекурсивный вызов и порождение новых потоков внутри ядра. До Kepler GK110 это было невозможно. И обратите внимание, что не вся архитектура Kepler поддерживает это, только GK110.
Если вам нужна рекурсия, вам, вероятно, нужен Tesla K20.
Я не уверен, поддерживает ли Ферми это, никогда не читал об этом. : \
Но Кеплер уверен, что делает. =)