Question

Я использую XGBClassifier для обучения Python, и в моем наборе обучающих данных есть несколько категориальных переменных.Первоначально я планировал преобразовать каждого из них в несколько манекенов до того, как я добавлю свои данные, но тогда важность функции будет рассчитываться для каждого манекена, а не для исходных категориальных.Так как мне также нужно упорядочить все мои исходные переменные (включая числовые + категориальные) по важности, мне интересно, как получить важность моих исходных переменных?Это просто сложение?

blacksite · Answer 1 · 15 ноября 2018

Возможно, вы могли бы обойтись суммированием значений отдельных категорий в их исходной родительской категории.Но, если эти функции не имеют большого количества элементов, мои два цента будут представлять их индивидуально.Я склонен ошибаться в том, чтобы более четко указывать показатели эффективности / важности модели отчетности.

Важность особенности xgboost категориальной переменной

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Важность особенности xgboost категориальной переменной

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы