Я использую регрессионные модели в наборе данных mtcars
и экспортирую результаты в фрейм данных
library(tidyverse)
library(broom)
outcomes <- c("wt", "mpg", "hp", "disp")
exposures <- c("gear", "vs", "am")
covariates <- c("drat", "qsec")
expand.grid(outcomes, exposures, covariates) %>%
group_by(Var1, Var2) %>%
summarise(Var3 = paste0(Var3, collapse = "+")) %>%
rowwise() %>%
summarise(frm = paste0(Var1, "~factor(", Var2, ")+", Var3)) %>%
group_by(model_id = row_number(),
frm, samplesize=nrow(mtcars)) %>%
do(tidy(lm(.$frm, data = mtcars))) %>%
ungroup()
Я знаю, mtcars
не содержит отсутствующих данных, но если мой фрейм данных содержал пропущенные значения, то будетстолбец samplesize
показывает размер выборки для каждой модели, т.е. для каждой комбинации frm
?