Повышение градиента с использованием Python - общий вопрос - PullRequest
0 голосов
/ 13 ноября 2018

Чего я хочу достичь.

Мои данные в следующем формате. Ежедневные расчеты цен на природный газ. Столбец А: отдельные строки с декабря 2018 года по декабрь 2026 года Колонка B: цена открытия газа с декабря 2018 года по декабрь 2026 года Колонка C: предыдущая цена на газ с декабря 2018 года по декабрь 2026 года.

Я хочу использовать алгоритм повышения градиента в Python для прогнозирования цен после декабря 2026 года, но я думаю, что обычно выходные данные алгоритма возвращают некоторый массив после реализации матрицы D и последующих команд, а затем запускают еще несколько шагов, чтобы придумать точечный график.

Вопрос.

Используя массив (сгенерированные данные), я теряюсь в том, что мне делать дальше, чтобы предсказать декабрь 2026 года и далее, потому что мой график рассеяния может просто взять обучающие и тестовые данные и сделать прогноз, но как насчет будущих лет, которые мои интерес.

1 Ответ

0 голосов
/ 13 ноября 2018

Если у вас нет данных за годы после 2026 года, у вас не будет возможности узнать, насколько хороши ваши модели за эти годы (это тавтологически).

Я думаю, что вы можете сделать одну вещьв этом случае взвешивайте ваш поезд, проверяйте и проверяйте разбиения на основе индекса даты и времени ваших данных.Запретив вашей модели «видеть будущее» в процессе обучения, вы можете получить приличное представление о том, насколько предсказуема ваша цель, измеряя производительность модели на «будущих» данных удержания после тренировки.Предположительно, в качестве сопровождающего модели вы затем обновите свои прогнозы (и проведете обучение), когда станут доступны новые данные за годы.

Полагаю, я также должен указать, что вы не указали вескую причину.почему xgboost и только xgboost подойдут для этой проблемы.Для моделей, которые могут быть запущены в производство, я бы посоветовал вам запустить некоторые регрессии или более дешевые алгоритмы и сравнить производительность.Если вы еще не ознакомились с некоторыми инструментами выбора моделей, думаю, это того стоит!Начать с чего проще: gridsearch: https://scikit -learn.org / stable / modules / generate / sklearn.model_selection.GridSearchCV.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...