Я обнаружил, что с помощью пакета boot
, подобного этому
library(boot)
calculate_mean_1 <- function(.data, i){
mean(.data$mpg[i])
}
system.time(
samples_1 <- boot(mtcars, statistic = calculate_mean_1, R=10000)$t
)
, я могу создать bootstrap семплов более чем в 10 раз быстрее, чем с помощью пакета rsample
:
library(tidyverse)
library(rsample)
calculate_mean_2 <- function(.data) {
mean(analysis(.data)$mpg)
}
system.time(
samples_2 <- bootstraps(mtcars, times = 10000) %>%
mutate(m = map_dbl(splits, calculate_mean_2))
)
Интересно, правильно ли я использую rsample
.