Question

HAi,

Я написал программу cuda, я дал функцию ядра ниже. Память устройства составляет
выделяется через CUDAMalloc (); значение * md равно 10;

__global__ void add(int *md)

{

    int x,oper=2;
    x=threadIdx.x;

   * md = *md*oper;

if(x==1)
   {
       *md = *md*0;
   }

   if(x==2)
   {
      *md = *md*10;
   }

   if(x==3)
   {
       *md = *md+1;
   }

   if(x==4)
   {
       *md = *md-1;
   }

}

выполнил вышеуказанный код

 add<<<1,5>>(*md) , add<<<1,4>>>(*md)

for <<<1,5>>> the output is 19

for <<<1,4>>> the output is 21

1) У меня есть сомнения, что cudaMalloc () будет выделяться в основной памяти устройства? 2) Почему только последний поток всегда выполняется в вышеуказанной программе?

Спасибо

jwdmsd · Answer 1 · 24 февраля 2011

Каждый поток в вашем коде записывает разные выходные данные в одно и то же место (md). В результате, когда программа заканчивает выполнение, md может иметь любое из 4-5 возможных значений.

Если вы хотите перехватить вывод каждого потока, вот что вы должны сделать

// The size of output is should be equal to the number of threads in your block
  __global__ void add (int input, int * output){  

     int x = threadIdx.x;
     int oper = 2;
      md = md*oper;


    //thread Index starts from 0 in CUDA

           if(x==0)
            output[0]= md*0;  // output is 0


          if(x==1)
            output[1] = md*10;  // output is 200


          if(x==2)
            output[2] = md+1;  // output is 21


          if(x==3)
            output[3] = md-1; // output is 19


       ..... and so on

    }

Выполнить код как

int value = 10;
int * out;
int size = 5*sizeof(int);
cudaMalloc((void**)&out,size );

add<<<1,5>>(value,out)

int * host_out = (int*)malloc(size);
cudaMemcpy(host_out,out,size,cudaMemcpyDeviceToHost);

//Now the host_out should have the following values:
//host_out[0] = 0
//host_out[1] = 200
//host_out[2] = 21
//host_out[3] = 19
//host_out[4] = ..

Потоки CUDA выводят другое значение

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Потоки CUDA выводят другое значение

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов