Как найти наиболее влиятельные независимые переменные в классификаторе стохастического градиентного спуска scikit-learn? - PullRequest
0 голосов
/ 01 октября 2018

Я делаю это:

from sklearn.linear_model import SGDClassifier
sgclass = SGDClassifier(random_state=10)
sgclass.fit(X_train,y_train)
pred = sgclass.predict(X_test)
from sklearn.metrics import classification_report,accuracy_score
print(classification_report(y_test, pred))
print(accuracy_score(y_test, pred)) 

Это полезные отчеты об отзыве и точности модели.

Однако как получить наиболее влиятельные независимые переменные, которые предсказывают зависимую переменную?Я начал с примерно 12 кандидатов и хочу видеть их ранговый порядок с точки зрения влияния в модели.

1 Ответ

0 голосов
/ 01 октября 2018

Как указано в документации , вы можете использовать атрибут coef_ , чтобы получить веса элементов.Чем больше абсолютное значение функции, тем больше ее важность.

Вы можете видеть, что в действии в классе выбора объектов из scikit, SelectFromModel .Лучшие характеристики выбираются из любого классификатора, который имеет атрибуты feature_importances_ или coef_ .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...