Могу ли я вызвать функцию времени выполнения CUDA из кода C ++, не скомпилированного nvcc? - PullRequest
9 голосов
/ 28 сентября 2010

Можно ли как-нибудь вызвать вызовы функций времени выполнения CUDA, такие как

cudaMemcpy(...);

в файле .cpp, скомпилированном обычным компилятором C ++?

Ответы [ 2 ]

17 голосов
/ 28 сентября 2010

EDIT: здесь был пример , но он больше не найден, но большая часть примера была скопирована ниже.

Звонящий C (но мог быть C ++)

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <cuda.h>

extern void kernel_wrapper(int *a, int *b);

int main(int argc, char *argv[])
{
   int a = 2;
   int b = 3;

   kernel_wrapper(&a, &b);

   return 0;
}

Калли (CUDA)

__global__ void kernel(int *a, int *b)
{
   int tx = threadIdx.x;

   switch( tx )
   {
case 0:
    *a = *a + 10;
    break;
case 1:
    *b = *b + 3;
    break;
default:
    break;
   }
}

void kernel_wrapper(int *a, int *b)
{
   int *d_1, *d_2;
   dim3 threads( 2, 1 );
   dim3 blocks( 1, 1 );

   cudaMalloc( (void **)&d_1, sizeof(int) );
   cudaMalloc( (void **)&d_2, sizeof(int) );

   cudaMemcpy( d_1, a, sizeof(int), cudaMemcpyHostToDevice );
   cudaMemcpy( d_2, b, sizeof(int), cudaMemcpyHostToDevice );

   kernel<<< blocks, threads >>>( a, b );

   cudaMemcpy( a, d_1, sizeof(int), cudaMemcpyDeviceToHost );
   cudaMemcpy( b, d_2, sizeof(int), cudaMemcpyDeviceToHost );

   cudaFree(d_1);
   cudaFree(d_2);
}
0 голосов
/ 03 июля 2018

вы можете использовать

g++ I/usr/local/cuda/include filename.cpp -o obj -L/usr/local/cuda/lib64 -lcudart

для компиляции или

nvcc filename.cu
...