В большинстве онлайн-отзывов говорится, что для подхода с произвольным лесом нет необходимости разбивать данные на обучающие и тестовые наборы. Однако я пытаюсь использовать следующую функцию Bagging (ipred), и я не знаю, нужно ли мне сначала разбивать данные на обучающие и тестовые наборы?
Должен ли я использовать приведенную ниже модель в мешках с использованием раздельного учебного набора или полного набора данных?
baggedsample <- bagging(p ~., fulldata, nbagg=500, coob=TRUE, control =
list (minbucket=5))
Кроме того, я хотел бы получить R-Squared «из сумки» для вышеприведенной модели, но следующий код выдает только «из сумки» rmse:
rmse <- baggedsample$err
Спасибо за любые советы по этому вопросу, спасибо.