Feature_importance для фиктивных переменных (sklearn.ExtraTrees) - PullRequest
0 голосов
/ 22 января 2019

Скажем, у меня есть фрейм данных df, который содержит 10 функций, но 9 из них являются категориальными, и я хочу установить классификатор ExtraTree для данных и получить значения функций.

Сейчас я используюпанды pd.get_dummies в одно горячее кодирование из 9 категориальных функций.Проблема в том, что при вызове etc.feature_importances_ (etc по классификатору) я получаю значения для каждого уровня каждой категории / фактора, а не фактора в целом, то есть все категориальные функции имеют 2 уровня, тогда я получаю2 * 9 + 1 = 19 функций.Мне бы хотелось, чтобы первоначальные значения 10 функций были такими.

...