Предположим, что мы используем «вес» по умолчанию для типа важности объекта.Похоже, что plot_importance смещает категорические особенности.Насколько я понимаю, XGBoost требует, чтобы категорические функции проходили сквозное кодирование.Следовательно, каждый категориальный признак преобразуется в N подкатегориальных признаков, где N - число возможных результатов для этого категориального признака.
Тогда каждый подкатегориальный признак будет конкурировать с остальными подкатегориальными признаками и всемичисловые особенности.Числовому признаку гораздо проще получить более высокий рейтинг, не так ли?