Я вычисляю выходные данные модели для линейной регрессии для зависимой переменной с 45 различными значениями идентификатора. Как я могу использовать код tidy (dplyr, apply и т. Д.) Для достижения этой цели?
У меня есть набор данных с тремя переменными data
= c(id
, distance
, actPct)
такой, что id
== 1:45; -10 <= <code>distance <= 10; 0 <= <code>actsPct <= 1. </p>
Мне нужно запустить регрессию model0n
для каждого значения id
, чтобы model0n
вставил новый тиббл / df. Я завершил это для одной регрессии:
model01 <- data %>%
filter(id == 1) %>%
filter(distance < 1) %>%
filter(distance > -4)
model01 <- lm(data = model01, actPct~distance)
Пример данных
set.seed(42)
id <- as.tibble(sample(1:45,100,replace = T))
distance <- as.tibble(sample(-4:4,100,replace = T))
actPct <- as.tibble(runif(100, min=0, max=1))
data01 <- bind_cols(id=id, distance=distance, actPct=actPct)
attr(data01, "col.names") <- c("id", "distance", "actPct")
Я ожидаю новый tibble или dataframe, который имеет model01
: model45
, поэтому я могу поместить все результаты регрессии в одну таблицу.