Я посмотрел код gcc libstdc ++ 4.7 реализации std :: discrete_distribution.
Веса хранятся как vector<double>
в приватном элементе. Нет доступа к его методу изменения размера в общедоступном интерфейсе.
Я постараюсь выкопать реализацию его оператора () (который находится в cpp, похоже), не должно быть никаких проблем, чтобы свернуть свой.
Вот основное действие, а мое объяснение следующее:
template<typename _IntType>
void
discrete_distribution<_IntType>::param_type::
_M_initialize()
{
if (_M_prob.size() < 2)
{
_M_prob.clear();
return;
}
const double __sum = std::accumulate(_M_prob.begin(),
_M_prob.end(), 0.0);
// Now normalize the probabilites.
__detail::__transform(_M_prob.begin(), _M_prob.end(), _M_prob.begin(),
std::bind2nd(std::divides<double>(), __sum));
// Accumulate partial sums.
_M_cp.reserve(_M_prob.size());
std::partial_sum(_M_prob.begin(), _M_prob.end(),
std::back_inserter(_M_cp));
// Make sure the last cumulative probability is one.
_M_cp[_M_cp.size() - 1] = 1.0;
}
template<typename _IntType>
template<typename _UniformRandomNumberGenerator>
typename discrete_distribution<_IntType>::result_type
discrete_distribution<_IntType>::
operator()(_UniformRandomNumberGenerator& __urng,
const param_type& __param)
{
if (__param._M_cp.empty())
return result_type(0);
__detail::_Adaptor<_UniformRandomNumberGenerator, double>
__aurng(__urng);
const double __p = __aurng();
auto __pos = std::lower_bound(__param._M_cp.begin(),
__param._M_cp.end(), __p);
return __pos - __param._M_cp.begin();
}
Таким образом, в основном он вычисляет вспомогательный вектор _M_cp
во время инициализации, который по существу является дискретной кумулятивной функцией плотности весов. Таким образом, создание выборки просто означает генерацию единой случайной переменной и поиск ее первого вхождения в накопительном распределении (это вызов lower_bound выше), возвращая его индекс.
например, если вектор весов равен:
{ 1, 2, 1, 3 }
тогда cp рассчитывается как:
{ 1, 1+2, 1+2+1, 1+2+1+3 }
=
{ 1, 3, 4, 7 }
поэтому я равномерно выбираю из 0..6 и получаю 4, поэтому я выбираю третий.