Как сохранить заполненные недостающие данные после использования XGBClassifier? - PullRequest
0 голосов
/ 02 мая 2020

У меня есть набор данных, в котором отсутствуют значения, но это не проблема для XGBClassifier. Он может динамически заполнить значение для вас. Я хочу сохранить функции по мере их заполнения XGBClassifier. Моя цель - использовать XGBoost для расчета отсутствующих данных, а затем я попробую другие алгоритмы, которые не допускают значений NaN. Это возможно?

1 Ответ

2 голосов
/ 02 мая 2020

XGBoost может обрабатывать пропущенные значения, но не заполняет их. Таким образом, ответ «нет», вы не можете использовать его для некоторых, как заполнить пропущенные значения в функции.

Во время обучения он обрабатывает недостающие данные, выбирая направление, которое минимизирует потери при каждом разделении. Таким образом, весь процесс, связанный с обработкой пропущенных данных, заключается в выборе оптимального пути на основе того, насколько минимизирована функция потерь, но при этом не происходит вменения значения.

Это упоминается в публикация :

Из данных получены оптимальные направления по умолчанию. Ключевым улучшением является посещение только не пропущенных записей Ik. Представленный алгоритм рассматривает отсутствие как пропущенное значение и определяет наилучшее направление для обработки пропущенных значений

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...