Мое ядро cuda генерирует что-то, что подается на хост в конце выполнения блока. Скелет выглядит...
Сегодня я добавил еще четыре __local переменные в свое ядро, чтобы вывести промежуточные результаты