Важность особенностей между числовыми и категориальными функциями для XGBoost - PullRequest
0 голосов
/ 23 сентября 2018

Предположим, что мы используем «вес» по умолчанию для типа важности объекта.Похоже, что plot_importance смещает категорические особенности.Насколько я понимаю, XGBoost требует, чтобы категорические функции проходили сквозное кодирование.Следовательно, каждый категориальный признак преобразуется в N подкатегориальных признаков, где N - число возможных результатов для этого категориального признака.

Тогда каждый подкатегориальный признак будет конкурировать с остальными подкатегориальными признаками и всемичисловые особенности.Числовому признаку гораздо проще получить более высокий рейтинг, не так ли?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...