Вопрос по разделению данных для функции упаковки в мешки и подсчета из сумки R-Squared - PullRequest
0 голосов
/ 29 мая 2019

В большинстве онлайн-отзывов говорится, что для подхода с произвольным лесом нет необходимости разбивать данные на обучающие и тестовые наборы. Однако я пытаюсь использовать следующую функцию Bagging (ipred), и я не знаю, нужно ли мне сначала разбивать данные на обучающие и тестовые наборы?

Должен ли я использовать приведенную ниже модель в мешках с использованием раздельного учебного набора или полного набора данных?

baggedsample <- bagging(p ~., fulldata, nbagg=500, coob=TRUE, control = 
list (minbucket=5))

Кроме того, я хотел бы получить R-Squared «из сумки» для вышеприведенной модели, но следующий код выдает только «из сумки» rmse:

rmse <- baggedsample$err

Спасибо за любые советы по этому вопросу, спасибо.

...