Операция уменьшения тяги является блокирующей операцией на стороне хоста. Я предполагаю, что вы используете результат редукции в качестве параметра для одного из ваших следующих ядер. Таким образом, когда вы захватываете граф CUDA, он не может создать экземпляр исполняемого файла графа, поскольку вы зависите от переменной, которая находится на стороне хоста, но недоступна, пока ядро редукции не завершит выполнение. В качестве решения вы можете попробовать добавить узел хоста к вашему графику, который возвращает результат сокращения.