Как предсказать значение y с набором тестовых данных? - PullRequest
0 голосов
/ 30 октября 2018

Я успешно построил модель логистической регрессии, используя приведенный ниже набор данных поезда.

X = train.drop('y', axis=1)
y = train['y']

X_train, X_test, y_train, y_test = train_test_split(X, y, 
                                                    test_size=0.5)

scaler = StandardScaler()  
scaler.fit(X_train)

X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

logreg1 = LogisticRegression()
logreg1.fit(X_train, y_train)

score = logreg1.score(X_test, y_test)
cvs = cross_val_score(logreg1, X_test, y_test, cv=5).mean()

Моя проблема в том, что я хочу ввести тестовый набор данных, чтобы предсказать неизвестное значение y. В данных теста нет столбца y. Как я могу предсказать значение у, используя отдельный набор тестовых данных?

1 Ответ

0 голосов
/ 30 октября 2018

Использовать прогноз ():

y_pred = logreg1.predict(X_test)
score = logreg1.score(X_test, y_pred)
print(y_pred)     // see the predictions
...