Прогноз многомерного временного ряда с XGBoost - PullRequest
0 голосов
/ 25 июня 2019

Я пытаюсь прогнозировать продажи на следующие месяцы, используя около 25 других функций за последние 48 месяцев.Я создал 12 лагов для всех функций.В итоге у меня было около 200 функций и всего 48 сэмплов для обучения.

Я использую регрессор XGBoost, результат получился плохим, однако я заметил, что model.score (train_features, target) дает 99%, в то время как перекрестная оценка в 3 раза составляет -13%, 44%, 17%.Я еще не коснулся тестового набора данных.Я переоснащаюсь?Является ли модель слишком сложной, так как число переменных больше, чем количество выборок?Что может быть хорошей отправной точкой для улучшения?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...