У меня большой набор данных, и я хочу выбрать из него случайные подмножества (randomly_live), а затем запустить модель (логистическая регрессия) в R. Поэтому я хочу запустить 100 логистических регрессий, чтобы подсчитать, сколько раз коэффициенты были с положительнымиподпиши, сколько раз они были значительными и показывают лучшую модель по критериям Хосмера-Лемешоу.
Я думаю, что это возможно сделать по циклу, но я чувствую себя действительно смущенным этим.
Этоэто кусок кода, который у меня есть для одной итерации
randomRows = function(df,n){
return(df[sample(nrow(df),n),])
}
set.seed(567)
df.split <- split(full_data, full_data$ID)
df.sample <- lapply(df.split, randomRows, 1)
df.final <- do.call("rbind", df.sample)
randomly_live <- randomRows(df.final, nrow(default))
data1 <- rbind(default, randomly_live)
model = glm(default ~ log(assets)+…+H1, data = data1,
family = 'binomial')
library(ResourceSelection)
hl <- hoslem.test(model$y, fitted(model), g=10)
Может кто-нибудь, пожалуйста, помогите?