У меня есть две модели на выбор, и по некоторым критериям я выбираю одну из двух. (Ниже приведен только пример, я знаю, что это не имеет особого смысла)
library(forecast)
set.seed(4)
sample_dat= sample(1:nrow(cars), 5)
train = cars[-sample_dat, ]
test = cars[sample_dat, ]
models = list(lm(dist ~ speed, train), glm(dist ~ speed, train, family = "poisson"))
test_res = sapply(models, function(x) accuracy(predict(x, test, type = "response"), test$dist)[2]) #Getting the RMSE for each model
best_model = models[which.min(test_res)]
Как я могу переобучить лучшую модель, используя полный набор данных (поезд + тест)? Я проверил функции update
и update.formula
, но, похоже, они не обновляют часть данных.