Я бы хотел сделать выборку из полиномиального распределения. Я бы сделал это, используя образец и указав некоторые вероятности.
Например: у меня есть 3 категории, и я хочу сделать выборку 10 раз.
> my_prob = c(0.2, 0.3, 0.5)
> x = sample(c(0:2), 100, replace = T, prob = my_prob)
> head(x)
[1] 2 0 2 1 1 2
Мои настройки теперь отличаются только в следующем аспекте: я хочу сэмплировать много (например, 1e09) чисел. И на самом деле меня интересует только частота каждой категории.
Таким образом, в приведенном выше примере это будет означать:
> table(x)
x
0 1 2
27 29 44
У кого-нибудь есть идеи, как рассчитать это максимально эффективно?
спасибо,
Штеффи