Я хотел бы использовать данные, помеченные как train
, чтобы соответствовать модели, а затем использовать данные, помеченные как test
, для прогнозирования новых значений.Я хотел бы сделать это в сценарии " много моделей ".
Ниже приведены мои текущие настройки.Моя проблема в том, что я тренируюсь и добавляю прогнозы ко всем данным.Я не знаю, как различить, используя modelr
library(modelr)
library(tidyverse)
library(gapminder)
# nest data by continent and label test/train data
nested_gap <- gapminder %>%
mutate(test_train = ifelse(year < 1992, "train", "test")) %>%
group_by(continent) %>%
nest()
# make a linear model function
cont_model <- function(df) {
lm(lifeExp ~ year, data = df)
}
# fit a model and add predictions to all data
fitted_gap <- nested_gap %>%
mutate(model = map(data, cont_model)) %>%
mutate(pred = map2(data, model, add_predictions))