Прогнозируемое значение изменяется для той же модели GBM для того же набора входных данных при повторном запуске - PullRequest
0 голосов
/ 30 января 2019

Я прогнозирую веб-трафик на следующие 7 дней, используя модель повышения градиента.

n=200
set.seed(123)
predict_traffic<-gbm(traffic~log(rolling_traffic_26day_avg)+week+weekday+is_holiday+month,
             data=df,
             distribution = "gaussian",
             interaction.depth=2,
             bag.fraction=0.8,
             n.trees = n)

Переменная roll_traffic_26day_avg - это среднее значение за последние 26 дней (6 месяцев).Например, значение на 1 января 2019 года во вторник является средним за последние 26 вторников (, исключая 1 января 2019 года ).

Я обучил модель на данных с 1 января 2017 года по 20 января 2019 годаМой набор данных тестирования - с 21 января по 27 января 2019 года. Я не могу предсказать более 7 дней из-за скользящей переменной.

df_test$predicted_traffic<-predict.gbm(predict_traffic,df_test,n.trees=200)

Я сделал модель gbm и сохранил ее.Теперь, когда я прогнозирую с 23 января по 27 января 2019 года на основе той же модели, значение для 27 января 2019 года изменится.

Прогноз на 27 января 2019 года в первом наборе тестовых данных: 155 Прогноз на 27 января 2019 года во втором наборе тестовых данных: 133 * Эта природа применима ко всем прогнозируемым датам. * Может кто-нибудь объяснить, почему это происходит?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...