Как найти наиболее важные особенности категории относительно цели для моделей регрессии? - PullRequest
0 голосов
/ 11 сентября 2018

Для числовых функций в моделях регрессии можно использовать функцию корреляции, чтобы выяснить наиболее важные числовые характеристики. Например,

corr=train.corr()
corr.sort_values(['SalePrice'], ascending = False, inplace = True)
print(corr.SalePrice)

Приведенный выше скрипт может ранжировать корреляцию объектов с SalePrice для числовых объектов.

Как вы выполняете аналогичное задание для функций категории?

1 Ответ

0 голосов
/ 11 сентября 2018

Корреляционная мера для категориальных признаков отсутствует, однако вы можете запустить ANOVA, чтобы найти, существуют ли различия в категориях, а затем использовать t-тесты или что-то подобное, чтобы найти значимые и, возможно, ранжировать их по p-значениям.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...