У меня есть Pandas DataFrame, который составляет 3420 строк x 13 столбцов, где я пытаюсь предсказать метку 'FTR', которая является либо 1, либо 0. Для этого я использую LogisticRegression от Scikit learn. Моя проблема в том, что моя модель предсказывает 100% правильно, что кажется неверным. У меня есть следующий код ниже:
dataCopy = dataCopy[['FTHG', 'FTAG', 'FTR', 'HTGS', 'ATGS', 'HTGC', 'ATGC', 'HTP', 'ATP', 'HomeTeamLP', 'AwayTeamLP', 'MW', 'HTGD', 'ATGD', 'DiffPts', 'DiffFormPts', 'DiffLP']]
X_all = dataCopy.drop(['FTR'],axis=1)
y_all = dataCopy.FTR
X_train, X_test, y_train, y_test = train_test_split(X_all, y_all, test_size=0.3)
LogReg = LogisticRegression()
LogReg.fit(X_train, y_train)
y_pred = LogReg.predict(X_test)
print(classification_report(y_test, y_pred))
Распечатка отчета о классификации показывает это:
Я был бы очень признателен, если кто-то может сказать мне, почему я получаю 100%, потому что это кажется неправильным.