Как выбрать функцию для модели прогнозирования, используя каретку для категориальной переменной? - PullRequest
0 голосов
/ 18 июня 2019

Я обнаружил, что набор кареток в R очень полезен для просмотра переменных важности для моделирования. Но у меня есть все категориальные переменные в моем наборе данных, в этом случае команда «varImp» возвращает значение переменной для каждой метки факторных переменных. я просто хочу определить список важных различных переменных, а не с меткой.

library(caret)
logit <- glm(Life.Insurance.Owner~., data = train, family = 'binomial')
summary(logit)

varImp(logit,scale=FALSE)

1 Ответ

0 голосов
/ 18 июня 2019

Как вы упомянули «все категориальные переменные в наборе данных». Любая возможность взглянуть на переменные. Каков размер уровней в каждой переменной?

Одна возможная вещь, которую вы можете сделать так - преобразовать категориальные переменные в фиктивные переменные. И теперь ваш набор данных представляет непрерывные переменные. [Но, опять же, это зависит от конкретного случая и - также помните о своей цели.]

Простой пример создания фиктивных переменных:

х = с (красный, синий, зеленый)

y = c (Автобус, поезд, лодка)

x.dummy = model.matrix (~ x - 1, данные = x)

y.dummy = model.matrix (~ y - 1, data = y)

...