какая функция выборки в R помогает обеспечить требуемую схему выборки? - PullRequest
0 голосов
/ 05 октября 2018

У меня есть следующая таблица:

enter image description here

Согласно этому примеру, есть 40 наблюдений, распределенных по 10 магазинам и 4 неделям месяца.Цель: сделать выборку из 90%, 80%, 75% и 50% из 40 наблюдений так, чтобы: 1) в результате все магазины были охвачены выборкой 2) в результате были покрыты все неделипо образцу.

Например, для выборки 70% требуется взять 28 наблюдений.Один из вариантов заключается в том, чтобы сделать это, чтобы выбрать все магазины, и все недели могут выглядеть следующим образом:

28 наблюдений за 4 недели - 7 наблюдений в неделю.Мы делаем выбор таким образом, чтобы максимально разнообразить выборку в контексте магазинов, то есть мы стремимся минимизировать перекрытие цветных областей для каждой точки, если это возможно.

enter image description here

Трудность нахождения функции заключается в том, что я не понимаю, что такое метод выборки: это кластерная выборка и стратифицированная и даже с вероятностной зависимостью, и кажется, что даже при балансировке(старайтесь не повторять точки выборки, если это возможно)

Upd: Я смотрю пакет выборки, но не могу найти правильное решение

1 Ответ

0 голосов
/ 05 октября 2018

Может быть, думать об этом как о дизайне экспериментов может помочь.Например, взгляните на Перекрестная проверка : алгоритм создания многоуровневого дробного факторного плана

Решение AlgDesign на этой странице, примененное к вашей задачеможет выглядеть следующим образом:

install.packages("AlgDesign")
library(AlgDesign)

cand  <-  gen.factorial(levels=c(10, 4),
                        nVars= 2,
                        factors="all", varNames = c("A", "B"))

des  <-  optFederov( ~ ., data=cand, nTrials = 20)

приводит к

 des$design
    A B
1   1 1
2   2 1
5   5 1
6   6 1
7   7 1
12  2 2
13  3 2
14  4 2
18  8 2
20 10 2
21  1 3
24  4 3
26  6 3
29  9 3
30 10 3
33  3 4
35  5 4
37  7 4
38  8 4
39  9 4
...