XGBoost извлекает обучающие прогнозы - PullRequest
0 голосов
/ 25 мая 2018

При создании модели с очень шумным набором данных мне нужно извлечь прогнозы, сделанные окончательной моделью XGBoost на тренировочном наборе.Я знаю, что могу извлечь прогнозы из-за сгиба из xgb.cv, но тогда я не смогу использовать это для прогнозирования на удерживаемом наборе тестов.

Я ценю, что это не обычный вариант использования, но это необходимо, поэтому найдите, какие образцы представляют выбросы в тренировочном наборе для дальнейшего исследования и последующего наложения моделей.

Есть ли способпоказать прогнозы, сделанные на тренировках, установленных окончательной моделью?Я бы подумал, так как я могу получить ошибку в каждом раунде, но не могу найти способ.

Ответы [ 2 ]

0 голосов
/ 25 мая 2018

Подумав немного больше, может показаться, что то, что я ищу, является аналогом предсказаний Рэндом Фореста из пакета.Однако из-за природы повышенных деревьев на самом деле не существует «истинной» выборки OOB, поскольку любая предыдущая выборка могла появиться в предыдущих деревьях.

Я думаю, что самым близким подходом было бы взять прогнозы изМодель CV XGB, использующая те же параметры и случайные семена, что и обученная модель.

0 голосов
/ 25 мая 2018

Простите, если я неправильно понял вопрос, но не будет predict() работать?

model = xgboost(data = data$train, nround = 20,param=param)
training_predictions = predict(model, data$train)

Кроме того, я нахожусь на машине, где я не могу установить XGB, но я довольноубедитесь, что объект модели имеет окончательные прогнозы в качестве одного из элементов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...