Я реализую алгоритм линейной регрессии с использованием Python.
У меня есть ниже набор данных в Excel введите описание изображения здесь
Когда я бегу ниже кода, код r2_scoreЗначение & intercept_ приходит как отрицательное.Я знаю, что отрицательный показатель r2 означает, что прогноз хуже.Может кто-нибудь подсказать мне, что я делаю не так?
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
file = pd.read_csv("heart-disease_1.csv")
X = file.drop("num", axis=1)
y = file["num"]
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.20)
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
# Fit the data(train the model)
lr.fit(X_train,y_train)
# Predict
y_predicted = lr.predict(X_test)
print(lr.coef_)
print(lr.intercept_)
from sklearn.metrics import r2_score
print(r2_score(y_test,y_predicted))
вывод:
coef_: [0.02324541 0.61279124 0.02102044 0.00361862]
intercept_: -5.918421626295825
r2_score: -0.44135602407107744
Process finished with exit code 0