Поддерживает ли sklearn выбор функций для данных Dynami c? - PullRequest
0 голосов
/ 27 апреля 2020

sklearn содержит реализацию различных методов выбора функций (filter/wrapper/embedded).

Все эти методы предназначены для систем c.

Поддерживает ли sklearn выбор функций в динамическом режиме c данные? (Данные, которые меняются со временем)

В динамических данных c нам необходимо повысить эффективность выбора признаков, чтобы быть более эффективными.

Я нашел некоторые методы в IEEE (инкрементные подходы для выбора функций). Так есть ли реализация в sklearn или другой библиотеке с открытым исходным кодом?

1 Ответ

0 голосов
/ 29 апреля 2020

Не могли бы вы просто перезапустить процесс по расписанию и загрузить данные динамически? Я бы не ожидал, что зависимая переменная вообще изменится, но я полагаю, что независимые переменные могут несколько измениться.

#1)  load your dataframe
#2)  copy your target variable into a new dataframe

y = df[['SeriousDlqin2yrs']]

#3)  drop your target variable

x = df[df.columns[df.columns!='SeriousDlqin2yrs']]

Наконец, запустите это.

from sklearn.ensemble import RandomForestClassifier
features = np.array(x)
clf = RandomForestClassifier()
clf.fit(x, y)
# from the calculated importances, order them from most to least important
# and make a barplot so we can visualize what is/isn't important
importances = clf.feature_importances_
sorted_idx = np.argsort(importances)
padding = np.arange(len(features)) + 0.5
plt.barh(padding, importances[sorted_idx], align='center')
plt.yticks(padding, features[sorted_idx])
plt.xlabel("Relative Importance")
plt.title("Variable Importance")
plt.show()

Я только что попробовал это и получил этот результат.

enter image description here

Если вы ожидаете получить функции, отличные от нумерации c, вам потребуется использовать одну горячую кодировку для обработки эти.

import pandas as pd
pd.get_dummies(df)

http://queirozf.com/entries/one-hot-encoding-a-feature-on-a-pandas-dataframe-an-example

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...