Допустим, у меня есть некоторый общий набор данных, для которого регрессия OLS является лучшим выбором.Итак, я генерирую модель с некоторыми терминами первого порядка и решаю использовать каретку в R для моих оценок коэффициентов регрессии и оценок ошибок.
В каретке это в конечном итоге:
k10_cv = trainControl(method="cv", number=10)
ols_model = train(Y ~ X1 + X2 + X3, data = my_data, trControl = k10_cv, method = "lm")
Оттуда я могу получить информацию о регрессии, используя summary(ols_model)
, а также могу получить дополнительную информацию, просто позвонив ols_model
.
Когда я просто смотрю на ols_model
, это RMSE / R-квадрат/ MAE рассчитывается с помощью типичного CV-кратного подхода?Кроме того, когда генерируется модель, которую я вижу в summary(ols_model)
, обучается ли эта модель по всему набору данных или это среднее из моделей, сгенерированных по каждому из сгибов?
Если нет, в интересах торговлидисперсия для смещения, есть ли способ приобрести модель OLS в рамках Caret, которую обучают по одному разу за раз?