У меня есть следующая таблица:
Согласно этому примеру, есть 40 наблюдений, распределенных по 10 магазинам и 4 неделям месяца.Цель: сделать выборку из 90%, 80%, 75% и 50% из 40 наблюдений так, чтобы: 1) в результате все магазины были охвачены выборкой 2) в результате были покрыты все неделипо образцу.
Например, для выборки 70% требуется взять 28 наблюдений.Один из вариантов заключается в том, чтобы сделать это, чтобы выбрать все магазины, и все недели могут выглядеть следующим образом:
28 наблюдений за 4 недели - 7 наблюдений в неделю.Мы делаем выбор таким образом, чтобы максимально разнообразить выборку в контексте магазинов, то есть мы стремимся минимизировать перекрытие цветных областей для каждой точки, если это возможно.
Трудность нахождения функции заключается в том, что я не понимаю, что такое метод выборки: это кластерная выборка и стратифицированная и даже с вероятностной зависимостью, и кажется, что даже при балансировке(старайтесь не повторять точки выборки, если это возможно)
Upd: Я смотрю пакет выборки, но не могу найти правильное решение