Какие входные данные я должен предоставить модели, которая содержит фиктивные переменные при прогнозировании в методе .predict ()? - PullRequest
0 голосов
/ 18 февраля 2020

Ниже приведен фрагмент кода для объяснения:

X = pd.get_dummies(X, columns=['Gender','Job','Status','Credit.History','Purpose','Dependents'])

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3,random_state=42)

from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)

model_rf = rf.fit(X_train, y_train)
y_pred = model_rf.predict(X_test)

#Now I am pickling the model as below:

import pickle
# Saving model to disk
pickle.dump(model_rf, open('model.pkl','wb'))

# Loading model to compare the results
model = pickle.load(open('model.pkl','rb'))

#Here I want to provide actual X features rather than dummy ones.
print(model.predict([[14, 88, 3, 1,........ ]]))

Поэтому мой вопрос заключается в том, нужно ли мне вводить все фиктивные переменные в методе .predict (), или есть какие-либо переменные для обратных фиктивных переменных

...