Я пытаюсь прогнозировать продажи на следующие месяцы, используя около 25 других функций за последние 48 месяцев.Я создал 12 лагов для всех функций.В итоге у меня было около 200 функций и всего 48 сэмплов для обучения.
Я использую регрессор XGBoost, результат получился плохим, однако я заметил, что model.score (train_features, target) дает 99%, в то время как перекрестная оценка в 3 раза составляет -13%, 44%, 17%.Я еще не коснулся тестового набора данных.Я переоснащаюсь?Является ли модель слишком сложной, так как число переменных больше, чем количество выборок?Что может быть хорошей отправной точкой для улучшения?