На sklearn
вы можете использовать sklearn.feature_selection.SelectFromModel
, что позволит вам подогнать модель под все ваши функции и выбрать только те функции, которые имеют большее значение в этой модели, например RandomForest
.Метод get_support()
дает вам важные функции.
from sklearn.ensemble import RandomForestClassifier
from sklearn.feature_selection import SelectFromModel
clf = RandomForestClassifier()
sfm = SelectFromModel(clf)
sfm.fit(X,y)
sfm.get_support()