Я пытался выполнить классификацию с помощью функции gum в R
library(gbm)
set.seed(1)
boost.goodwine = gbm(goodwine~.-quality,data = traindata,shrinkage = 0.01, cv.folds = 5,distribution = 'bernoulli',n.trees = 3000,interaction.depth = 3)
Здесь, goodwine - это набор из двух классов (0 и 1)
head(goodwine)
0 0 1 1 0 0
Мой вопросчто если я изменю доброе вино на факторы, то gbm выдаст ошибку, говоря, что
goodwine = as.factor(goodwine)
Error in res[flag, ] <- predictions : replacement has length zero
Но если я сохраню доброе вино в виде числовых значений, это даст мне удовлетворительный результат, но я боюсь, что если я сохраню 0, 1 как числовые значения, gbm распознал бы это как проблему регрессии.
Может кто-нибудь дать мне объяснение, или я предполагаю, что 'distribution =' bernoulli 'автоматически определит это как проблему классификации.