гбм в R: что такое $ fit? - PullRequest
2 голосов
/ 15 июня 2019

В пакете R gbm, что является элементом fit объекта gbm?

В документации говорится, что это «вектор, содержащий подогнанные значения на шкале функции регрессии (например, logшкала Бернулли, логарифмическая шкала Пуассона).Это кажется достаточно ясным, но я бы ожидал, что оно будет таким же, как предсказания predict(), примененные к тренировочным данным, но это не так.

Пример:

library(gbm)

set.seed(1)

gbm.iris <- gbm(Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
                data = iris, distribution = "multinomial",
                bag.fraction = 1, n.trees = 3)

# What is gbm.iris$fit ?

predict(gbm.iris, n.trees = 3)[, , 1] - gbm.iris$fit  # many entries are 0 but not all

# First 10 rows:

##         setosa versicolor  virginica
##  [1,]  0.00000  0.0000000  0.0000000
##  [2,]  1.15344 -0.4248330  0.0000000
##  [3,]  1.15344 -0.2223908 -1.0816416
##  [4,]  0.00000  0.0000000  0.0000000
##  [5,]  0.00000  0.0000000  0.0000000
##  [6,]  0.00000  0.0000000  0.0000000
##  [7,]  0.00000  0.0000000  0.0000000
##  [8,]  0.00000  0.0000000  0.0000000
##  [9,]  0.00000  0.0000000  0.0000000
## [10,]  0.00000  0.0000000  0.0000000

IИспользую gbm версия 2.1.5.Спасибо за любую помощь, вы можете дать.

1 Ответ

0 голосов
/ 29 июня 2019

Поскольку здесь не было ответов, я задал этот вопрос на странице GitHub gbm: https://github.com/gbm-developers/gbm/issues/41

Один из авторов, Грег Риджуэй, дал такой ответ:

Я бы порекомендовал перейти на gbm3, размещенный на github. И я бы не стал рекомендую использовать полиномиальную опцию gbm ... Я не думаю, что это когда-либо отлажен и имел ряд проблем. Мы фактически удалили его из gbm3.

Из этого я делаю вывод, что неожиданное поведение в моем примере, вероятно, было результатом ошибки.

...