Я рассчитываю повышающий градиент, чтобы определить важность переменных в модели, однако я выполняю повторные выборки, чтобы определить, как ведет себя важность каждой переменной.
Но я не могу правильно сохранить имя переменнойс его важностью, рассчитанной в каждой начальной загрузке.
Я делаю это с помощью функции, которая вызывается в команде пакета начальной загрузки boost
.
Ниже приведен минимально воспроизводимый пример, адаптированный дляДанные AmesHousing:
library(gbm)
library(boot)
library(AmesHousing)
df <- make_ames()
imp_gbm <- function(data, indices) {
d <- data[indices,]
gbm.fit <- gbm(
formula = Sale_Price ~ .,
distribution = "gaussian",
data = d,
n.trees = 100,
interaction.depth = 5,
shrinkage = 0.1,
cv.folds = 5,
n.cores = NULL,
verbose = FALSE
)
return(summary(gbm.fit)[,2])
}
results_GBM <- boot(data = df,statistic = imp_gbm, R=100)
results_GBM$t0
Я ожидаю сохранить результаты начальной загрузки с именами переменных, но могу сохранить только важность переменных без их имен.