Переоснащение Xgboost - как упростить модель? - PullRequest
0 голосов
/ 16 апреля 2020

Я обучаю модель xgboost прогнозированию еженедельных продаж. Я использую RMSE в качестве показателя c и для использования функций: номер недели, номер месяца, средние продажи, особенности отставания от продаж за последние 15 недель, среднее значение и дисперсия продаж за последние 3 месяца. Я также настраиваю модель, используя gridsearch. Мои параметры: Colsample 0.6, ETA 0.01, глубина дерева 3, подвыборка 0.6. Я пробовал также гамма = 10 в качестве регуляризации. У меня есть двухлетняя история для различных продуктов в качестве учебного набора. К сожалению, после нескольких итераций модель переоснащается (обучающему набору требуется около 3000 итераций, чтобы закрыть 0 RMSE, тогда как ошибка проверочного набора увеличивается. Что можно сделать, чтобы избежать такого поведения? Следует ли использовать лямбда, альфа-параметры? Может быть, использовать увеличение данных или, возможно, удалить большинство функций? Заранее спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...