Понимание значения дерева моделей XGBoost - PullRequest
1 голос
/ 16 марта 2019

Я создал модель XGBoost в Python и использовал следующий код для лучшего понимания модели:

xgb.plot_importance(model)

или

xgb.plot_importance(model, importance_type="gain")

Я могу понять, какие параметры имелисамая большая ценность, но мне кажется, что мне не хватает, чтобы сказать, что это за значения.

Предположим, я пытаюсь определить, сколько людей будут брать напрокат велосипеды в определенный день.Запуск двух методов plot_importance, описанных выше, может сказать мне, что «температура» и «день недели» являются наиболее важными параметрами при определении количества поездок на велосипеде.Что я хочу знать, так это то, какие из этих значений определяют большое количество поездок на велосипеде и какие значения определяют низкое количество поездок на велосипеде.

1 Ответ

1 голос
/ 16 марта 2019

Полагаю, вы пытаетесь визуализировать и отлаживать то, что алгоритм делает при прогнозировании.Для этого я бы порекомендовал проверить ELI5 , особенно ту часть, которая охватывает , работающую с XGBoost .Для подробного примера того, как использовать ELI5 с XGBoost для набора данных Titanic, посмотрите эту ссылку .

Чтобы объяснить прогноз, сделайте следующее:

from eli5 import show_prediction
show_prediction(moel, your_prediction, show_feature_values=True)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...