Question

Я делаю это:

from sklearn.linear_model import SGDClassifier
sgclass = SGDClassifier(random_state=10)
sgclass.fit(X_train,y_train)
pred = sgclass.predict(X_test)
from sklearn.metrics import classification_report,accuracy_score
print(classification_report(y_test, pred))
print(accuracy_score(y_test, pred))

Это полезные отчеты об отзыве и точности модели.

Однако как получить наиболее влиятельные независимые переменные, которые предсказывают зависимую переменную?Я начал с примерно 12 кандидатов и хочу видеть их ранговый порядок с точки зрения влияния в модели.

Fabio Picchi · Answer 1 · 01 октября 2018

Как указано в документации , вы можете использовать атрибут coef_ , чтобы получить веса элементов.Чем больше абсолютное значение функции, тем больше ее важность.

Вы можете видеть, что в действии в классе выбора объектов из scikit, SelectFromModel .Лучшие характеристики выбираются из любого классификатора, который имеет атрибуты feature_importances_ или coef_ .

Как найти наиболее влиятельные независимые переменные в классификаторе стохастического градиентного спуска scikit-learn?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как найти наиболее влиятельные независимые переменные в классификаторе стохастического градиентного спуска scikit-learn?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы