Важность особенности xgboost категориальной переменной - PullRequest
0 голосов
/ 15 ноября 2018

Я использую XGBClassifier для обучения Python, и в моем наборе обучающих данных есть несколько категориальных переменных.Первоначально я планировал преобразовать каждого из них в несколько манекенов до того, как я добавлю свои данные, но тогда важность функции будет рассчитываться для каждого манекена, а не для исходных категориальных.Так как мне также нужно упорядочить все мои исходные переменные (включая числовые + категориальные) по важности, мне интересно, как получить важность моих исходных переменных?Это просто сложение?

1 Ответ

0 голосов
/ 15 ноября 2018

Возможно, вы могли бы обойтись суммированием значений отдельных категорий в их исходной родительской категории.Но, если эти функции не имеют большого количества элементов, мои два цента будут представлять их индивидуально.Я склонен ошибаться в том, чтобы более четко указывать показатели эффективности / важности модели отчетности.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...