взять образец, который имеет конкретное среднее - PullRequest
0 голосов
/ 19 ноября 2018

Допустим, у меня есть популяция типа {1,2,3, ..., 23}, и я хочу сгенерировать выборку так, чтобы среднее значение выборки равнялось 6.

Я пытался использовать *Функция 1003 *, использующая пользовательский вектор вероятности, но он не работает:

population <- c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23)
mean(population)
minimum <- min(population)
maximum <- max(population)
amplitude <- maximum - minimum 
expected <- 6
n <- length(population)
prob.vector = rep(expected, each=n)
for(i in seq(1, n)) {
  if(expected > population[i]) {
    prob.vector[i] <- (i - minimum) / (expected - minimum)
  } else {
    prob.vector[i] <- (maximum - i) / (maximum - expected)
  }
}
sample.size <- 5
sample <- sample(population, sample.size, prob = prob.vector)
mean(sample)

Среднее значение выборки соответствует среднему значению совокупности (колеблется около 12), и я хотел, чтобы оно былооколо 6.

Хорошая выборка будет:

  • {3,5,6,8,9}, среднее значение = 6,2
  • {2,3,4,8,9}, среднее значение = 5,6

Проблема отличается от выборки целочисленных значений в R с определенным средним значением , потому что у меня есть конкретная совокупность, и я не могу простогенерировать произвольные действительные числа, они должны быть внутри совокупности.

График вектора вероятности: plot

1 Ответ

0 голосов
/ 19 ноября 2018

Вы можете попробовать это:

m = local({b=combn(1:23,5);
           d = colMeans(b);
           e = b[,d>5.5 &d<6.5];
           function()sample(e[,sample(ncol(e),1)])})
m()
[1] 8 5 6 9 3
m()
[1]  6  4  5  3 13

разбивка:

b=combn(1:23,5) # combine the numbers into 5
d = colMeans(b) # find all the means
e = b[,d>5.5 &d<6.5] # select only the means that are within a 0.5 range of 6
sample(e[,sample(ncol(e),1)]) # sample the values the you need
...