Как сделать средневзвешенное значение двух device_vectors с точками, выбранными с помощью карты в тяге? - PullRequest
0 голосов
/ 23 ноября 2018

У меня есть два device_vector P & Q (скажем, размера 100).У меня есть две карты device_vector (MapP & MapQ размером, скажем, 10) для P & Q, у которых есть индексы точек, которые нужно выбрать из P & Q. У меня есть device_vector D для веса.

Мне нужно вычислить(P * D + Q) / (D + 1) для всех точек из P & Q, которые были выбраны с использованием соответствующих карт.

Мой метод такой, как показано ниже.Это работает, но слишком громоздко. Кто-нибудь может предложить лучший способ сделать это?

#include <thrust/device_vector.h>
#include <thrust/random.h>
#include <thrust/sequence.h>
#include <thrust/execution_policy.h>
#include <thrust/transform.h>
#include <thrust/functional.h>
#include <thrust/iterator/transform_iterator.h>
#include <thrust/iterator/permutation_iterator.h>

thrust::device_vector<float> random_vector(const size_t N, 
                                         unsigned int seed = thrust::default_random_engine::default_seed)
{
    thrust::default_random_engine rng(seed);
    thrust::uniform_real_distribution<float> u01(0.0f, 10.0f);
    thrust::device_vector<float> temp(N);
    for(size_t i = 0; i < N; i++) {
        temp[i] = u01(rng);
    }
    return temp;
}

// note: functor inherits from unary_function
struct increment : public thrust::unary_function<int,int>
{
  __host__ __device__
  int operator()(int x) const
  {
    return x + 1;
  }
};

int main(int argc, char * argv[])
{

int N=atoi(argv[1]);

thrust::device_vector<float> P = random_vector(N,1);
thrust::device_vector<float> Q = random_vector(N,9);

thrust::device_vector<int> D(N);
thrust::sequence(thrust::device, D.begin(), D.begin() + N, 1);

thrust::device_vector<float> temp(10);

thrust::device_vector<int> MapP(10); // map
thrust::device_vector<int> MapQ(10); // map

MapP[0]=0;MapP[1]=5;MapP[2]=4;MapP[3]=2;MapP[4]=7;MapP[5]=1;MapP[6]=9;MapP[7]=3;MapP[8]=6;MapP[9]=8;
MapQ[0]=10;MapQ[1]=15;MapQ[2]=12;MapQ[3]=14;MapQ[4]=11;MapQ[5]=17;MapQ[6]=13;MapQ[7]=19;MapQ[8]=18;MapQ[9]=16;


// The weighted average is (D*P+Q)/(D+1)
// We compute D*P first

//thrust::transform(thrust::device, P.begin(), P.end(), D.begin(), temp.begin(), thrust::multiplies<float>()); // use permutation iterator

thrust::transform(thrust::device, thrust::make_permutation_iterator(P.begin(),MapP.begin()),
                                  thrust::make_permutation_iterator(P.end(),MapP.end()),
                  thrust::make_permutation_iterator(D.begin(),MapP.begin()), 
                  temp.begin(), thrust::multiplies<float>());


// Then we add D*p to Q

//thrust::transform(thrust::device, temp.begin(), temp.end(), Q.begin(), temp.begin(), thrust::plus<float>()); // use permutation iterator

thrust::transform(thrust::device, temp.begin(), temp.end(),
                  thrust::make_permutation_iterator(Q.begin(),MapQ.begin()), 
                  temp.begin(), thrust::plus<float>());


// Then we divide by D+1

//thrust::transform(thrust::device, temp.begin(), temp.end(), thrust::make_transform_iterator(D.begin(), increment()), temp.begin(),  thrust::divides<float>());

thrust::transform(thrust::device, temp.begin(), temp.end(),
                  thrust::make_permutation_iterator(D.begin(),MapP.begin()), 
                  temp.begin(), thrust::divides<float>());


// replace contents of P with the weighted sum using pts in map M

thrust::copy(thrust::device, temp.begin(), temp.end(), thrust::make_permutation_iterator(P.begin(),MapP.begin())); // use permutation iterator

return 0;
}

1 Ответ

0 голосов
/ 23 ноября 2018

Я предполагаю, что вы хотите поэлементную операцию с векторами, так как это поведение вашего предоставленного кода демонстратора.

Обратите внимание, что при прохождении конца итератора перестановки мы не используемконец исходного вектора:

thrust::make_permutation_iterator(P.end(),MapP.end()),
                                  ^^^^^

, но вместо начала:

thrust::make_permutation_iterator(P.begin(),MapP.end()),

См. руководство по быстрому запуску для примера этого.

Также обратите внимание, что как в вашем вопросе, так и в вашем коде вы имеете в виду деление на D + 1, но ваш код фактически делится на D, а не D + 1.

Что касается вашего вопроса, все может бытьделается с помощью одного вызова thrust::transform с соответствующим образом определенным функтором.Поскольку в этой реализации нам нужно передать несколько векторов thrust::transform, мы введем thrust::zip_iterator

$ cat t332.cu
#include <thrust/device_vector.h>
#include <thrust/random.h>
#include <thrust/sequence.h>
#include <thrust/execution_policy.h>
#include <thrust/transform.h>
#include <thrust/functional.h>
#include <thrust/iterator/transform_iterator.h>
#include <thrust/iterator/permutation_iterator.h>
#include <thrust/iterator/zip_iterator.h>

thrust::device_vector<float> random_vector(const size_t N,
                                         unsigned int seed = thrust::default_random_engine::default_seed)
{
    thrust::default_random_engine rng(seed);
    thrust::uniform_real_distribution<float> u01(0.0f, 10.0f);
    thrust::device_vector<float> temp(N);
    for(size_t i = 0; i < N; i++) {
        temp[i] = u01(rng);
    }
    return temp;
}

// The weighted average is (D*P+Q)/(D+1)
struct w_avg
{
template <typename T>
  __host__ __device__
  float operator()(T x) const
  {
    return (thrust::get<0>(x)*thrust::get<1>(x)+thrust::get<2>(x))/(thrust::get<1>(x)+1.0f);
  }
};

int main(int argc, char * argv[])
{

int N=atoi(argv[1]);

thrust::device_vector<float> P = random_vector(N,1);
thrust::device_vector<float> Q = random_vector(N,9);

thrust::device_vector<int> D(N);
thrust::sequence(thrust::device, D.begin(), D.begin() + N, 1);


thrust::device_vector<int> MapP(10); // map
thrust::device_vector<int> MapQ(10); // map

MapP[0]=0;MapP[1]=5;MapP[2]=4;MapP[3]=2;MapP[4]=7;MapP[5]=1;MapP[6]=9;MapP[7]=3;MapP[8]=6;MapP[9]=8;
MapQ[0]=10;MapQ[1]=15;MapQ[2]=12;MapQ[3]=14;MapQ[4]=11;MapQ[5]=17;MapQ[6]=13;MapQ[7]=19;MapQ[8]=18;MapQ[9]=16;


// The weighted average is (D*P+Q)/(D+1)

thrust::transform(thrust::device, thrust::make_zip_iterator(thrust::make_tuple(
                                                            thrust::make_permutation_iterator(P.begin(),MapP.begin()),
                                                            thrust::make_permutation_iterator(D.begin(),MapP.begin()),
                                                            thrust::make_permutation_iterator(Q.begin(),MapQ.begin()))),
                                  thrust::make_zip_iterator(thrust::make_tuple(
                                                            thrust::make_permutation_iterator(P.begin(),MapP.end()),
                                                            thrust::make_permutation_iterator(D.begin(),MapP.end()),
                                                            thrust::make_permutation_iterator(Q.begin(),MapQ.end()))),
                                                            thrust::make_permutation_iterator(P.begin(),MapP.begin()),
                                  w_avg());


for (int i = 0; i < 5; i++) {
  std::cout << P[i] << std::endl;}
return 0;
}
$ nvcc -o t332 t332.cu
$ ./t332 100
4.02976
3.75275
5.32832
8.53189
8.46641
$

. Обратите внимание, что функтор в приведенном выше коде делится на D + 1.Вместо этого было бы тривиально изменить его на деление на D, чтобы оно соответствовало вашему коду (но не вашему заявленному намерению).

...