Для начала вам нужен файл .cu с вашим ядром (функция, выполняемая на GPU). Давайте иметь файл mykernel.cu :
extern "C"
__global__ void fooFunction(float4* data) {
// there can be some CUDA code ...
}
Это должно быть скомпилировано в файл .cubin с компилятором nvcc . Чтобы сообщить компилятору о компиляторе Visual C ++, необходимо вызвать его из командной строки Visual Studio:
nvcc mykernel.cu --cubin
Это создает файл mykernel.cubin в том же каталоге.
Затем в коде C # вы можете загрузить этот двоичный модуль и запустить ядро. В объектном API более высокого уровня GASS.CUDA это может выглядеть так:
using GASS.CUDA;
// ...
CUDA cuda = new CUDA(true);
// select first available device (GPU)
cuda.CreateContext(0);
// load binary kernel module (eg. relative to from bin/Debug/)
CUmodule module = cuda.LoadModule("../../mykernel.cubin");
// select function from the module
CUfunction function = cuda.GetModuleFunction(module, "fooFunction");
// execute the function fooFunction() on a GPU
cuda.Launch(function);
Вот и все!
Компилятор nvcc лучше вызывать как действие сборки, чем вызывать его вручную. Если кто-нибудь знает, как этого добиться, сообщите нам.