Проблемы использования функции GBM для классификации в R - PullRequest
0 голосов
/ 04 декабря 2018

Я пытался выполнить классификацию с помощью функции gum в R

library(gbm)
set.seed(1)
boost.goodwine = gbm(goodwine~.-quality,data = traindata,shrinkage = 0.01, cv.folds = 5,distribution = 'bernoulli',n.trees = 3000,interaction.depth = 3)

Здесь, goodwine - это набор из двух классов (0 и 1)

head(goodwine)
0 0 1 1 0 0

Мой вопросчто если я изменю доброе вино на факторы, то gbm выдаст ошибку, говоря, что

goodwine = as.factor(goodwine)
Error in res[flag, ] <- predictions : replacement has length zero

Но если я сохраню доброе вино в виде числовых значений, это даст мне удовлетворительный результат, но я боюсь, что если я сохраню 0, 1 как числовые значения, gbm распознал бы это как проблему регрессии.

Может кто-нибудь дать мне объяснение, или я предполагаю, что 'distribution =' bernoulli 'автоматически определит это как проблему классификации.

...