Почему моя модель Sklearn LogistricRegression предсказывает 100% правильно? - PullRequest
0 голосов
/ 14 марта 2020

У меня есть Pandas DataFrame, который составляет 3420 строк x 13 столбцов, где я пытаюсь предсказать метку 'FTR', которая является либо 1, либо 0. Для этого я использую LogisticRegression от Scikit learn. Моя проблема в том, что моя модель предсказывает 100% правильно, что кажется неверным. У меня есть следующий код ниже:

dataCopy = dataCopy[['FTHG', 'FTAG', 'FTR', 'HTGS', 'ATGS', 'HTGC', 'ATGC', 'HTP', 'ATP', 'HomeTeamLP', 'AwayTeamLP', 'MW', 'HTGD', 'ATGD', 'DiffPts', 'DiffFormPts', 'DiffLP']]

X_all = dataCopy.drop(['FTR'],axis=1)
y_all = dataCopy.FTR

X_train, X_test, y_train, y_test = train_test_split(X_all, y_all, test_size=0.3)

LogReg = LogisticRegression()
LogReg.fit(X_train, y_train)
y_pred = LogReg.predict(X_test)

print(classification_report(y_test, y_pred))

Распечатка отчета о классификации показывает это:

enter image description here

Я был бы очень признателен, если кто-то может сказать мне, почему я получаю 100%, потому что это кажется неправильным.

1 Ответ

0 голосов
/ 15 марта 2020

Вы проверили логистика c весов регрессии? Это атрибут coef_ в вашей регрессии LogReg logisti c. Существует вероятность, что он делает прогнозы, используя одну из функций гораздо больше, чем другие. Если это так, целесообразно ли включать эту функцию в обучение?

Трудно точно диагностировать, что происходит с предоставленной информацией.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...