Как рассчитать R-квадрат после использования функции упаковки для разработки деревьев решений CART? - PullRequest
0 голосов
/ 27 мая 2019

Я использую следующую функцию упаковки с ipred для начальной загрузки образца 500 раз в R для разработки деревьев решений:

baggedsample <- bagging(p ~., data, nbagg=500, coob=TRUE, control = list 
(minbucket=5))

После этого я хотел бы знать R-квадрат.

Я заметил, что если я сделаю упаковку с помощью функции каретки, R-квадрат будет автоматически рассчитываться следующим образом:

# Specify 10-fold cross validation
ctrl <- trainControl(method = "cv",  number = 10) 

# CV bagged model
baggedsample <- train(
  p ~ .,
  data,
  method = "treebag",
  trControl = ctrl,
  importance = TRUE
  )

# assess results
baggedsample

RMSE      Rsquared   MAE     
##   36477.25  0.7001783  24059.85

Спасибо за любые рекомендации по этому вопросу, спасибо.

1 Ответ

1 голос
/ 27 мая 2019

Поскольку вы не предоставляете никаких данных, я проиллюстрирую использование встроенных данных радужной оболочки.

Вы можете просто вычислить R-квадрат по формуле.

attach(iris) 
BAG = bagging(Sepal.Length ~ ., data=iris)
R2 = 1 - sum((Sepal.Length - predict(BAG))^2) /
    sum((Sepal.Length - mean(Sepal.Length))^2)
R2
[1] 0.824782
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...