[После просмотра комментария joran о функции make_strata()
я подал проблему с rsample на Github.]
Я пытаюсь взять стратифицированные образцы начальной загрузки из фрейма данных.Я хочу, чтобы в каждом страте брались отдельные выборки начальной загрузки, чтобы полученная выборка начальной загрузки имела такое же количество наблюдений в каждой страте, что и исходный кадр данных.Однако это не всегда происходит при использовании функции bootstraps()
пакета rsample .Когда я запускаю этот код:
library(rsample)
mydf <- data.frame(A=1:58, B=rep(1:4, c(6, 6, 23, 23)))
lboots <- bootstraps(mydf, times=3, strata="B")$splits
lbootsdf <- lapply(lboots, as.data.frame)
with(mydf, table(B))
lapply(lbootsdf, function(df) table(df$B))
Вот результаты, которые я получаю:
B
1 2 3 4
6 6 23 23
$`1`
1 2 3 4
10 5 20 23
$`2`
1 2 3 4
3 8 24 23
$`3`
1 2 3 4
4 5 24 25
Я ожидал увидеть 6 1, 6 2, 23 3 и 23 4 в каждомиз трех образцов начальной загрузки.
Как я могу взять тот тип многослойной начальной загрузки, который мне нужен?