Это тангенциально связано с вашим вопросом, но я реализовал «рекурсивный» алгоритм обратного отслеживания для перечисления «обходов без участия пользователя» на решетке (примечание: стек моделировался в ядре CUDA, чтобы избежать накладных расходов создание локальных переменных для целой связки вызовов функций). Это можно сделать эффективно, поэтому я уверен, что это можно адаптировать к теоретическому контексту графа. Вот ссылка на семинар по этой теме, где я провел общее обсуждение вопроса о возврате в рамках парадигмы «Однократная инструкция с несколькими данными» (SIMD); это PDF размером около 1 МБ http://bit.ly/9ForGS.
Я не претендую на то, что знаю о более широкой литературе по теоретическим алгоритмам графов на графических процессорах, но надеюсь, что вышесказанное немного поможет.
(@ TheMachineCharmer, спасибо за ссылки.)