Я пытаюсь преобразовать простую программу CUDA в LLVM IR, используя Clang 3.0.Программа выглядит следующим образом:
#include <stdio.h>
#include <clang/test/SemaCUDA/cuda.h>
__global__ void kernfunc(int *a)
{
//kernel definition
*a = threadIdx.x + blockIdx.x * blockDim.x;
}
int main()
{
int *h_a, *d_a, n;
n = sizeof(int);
h_a = (int*)malloc(n);
*h_a = 5;
cudaMalloc((void*)&d_a, n);
cudaMemcpy(d_a, h_a, n, cudaMemcpyHostToDevice);
//kernel call
kernelfunc<<<1,1>>>(d_a);
cudaMemcpy(h_a, d_a, n, cudaMemcpyDeviceToHost);
printf("%d", *h_a);
return 0;
}
Какие дополнительные файлы заголовков должны быть включены?Какая часть кода в настоящее время не поддерживается Clang 3.0?