Как мне предсказать целевую переменную тестовых данных, когда у меня есть обученная модель? - PullRequest
0 голосов
/ 07 июня 2019

Учитывая данные банковского маркетинга, я обучил модель, используя дерево решений и классификаторы случайных лесов, теперь пытаюсь предсказать целевую переменную Y, но не знаю, как это сделать. Загружаю ли я обученные данные и данные испытаний в обученную модель и внедряю?

train_data = pd.read_csv('train_cleaned1.csv')
test_data = pd.read_csv('test_cleaned1.csv')

X = train_data.drop('Final_Y_1', axis=1)
y = train_data.Final_Y_1

X_train, X_test, y_train, y_test = train_test_split(X, y, 
test_size=0.3, random_state=42)

pipelines = {'rf' : make_pipeline(StandardScaler(), 

RandomForestClassifier(random_state=42, class_weight='balanced'))}

rf_hyperparameters = {'randomforestclassifier__n_estimators': [100, 
200],
                  'randomforestclassifier__max_features': ['auto', 
'sqrt', 0.33] }
hyperparameters = {'rf' : rf_hyperparameters}

fitted_rf_model = {}

for name, pipeline in pipelines.items():
rf_model = GridSearchCV(pipeline, hyperparameters[name], cv=10, 
n_jobs=-1)
rf_model.fit(X_train, y_train)
fitted_rf_model[name] = rf_model
print(name, 'has been fitted.')

for name, model in fitted_rf_model.items():
print(name, model.best_score_ )

Я все еще получаю хороший результат, но я не уверен, были ли введены тестовые данные и если да, то как мне это сделать? рф был установлен. рф 0,9004104109304379

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...