Как рассчитать r-квадрат с python? - PullRequest
0 голосов
/ 08 января 2020

Я установил модель, по которой я хотел бы узнать результаты (r-квадрат). Данные разбиты на набор для обучения и тестирования. Хотя модель обучается только с использованием обучающего набора, как возможно, что мой r-квадрат для моих данных тестирования выше? Я имею в виду, что модель никогда не видела тестовый набор, но более точна, чем с тренировочным набором ... Я что-то не так понимаю?

enter image description here

Мой код: импорт pandas как pd

import numpy
import numpy as np

import seaborn as sns
import matplotlib.pyplot as plt
import scipy
import sklearn
from sklearn.linear_model import LinearRegression
from scipy import stats
from sklearn.metrics  import mean_squared_error
from sklearn.model_selection import train_test_split
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import cross_val_predict

df=pd.read_csv("https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses- 
data/CognitiveClass/DA0101EN/module_5_auto.csv")
df=df._get_numeric_data()


y_data = df['price']
x_data=df.drop('price',axis=1)
x_train, x_test, y_train, y_test = train_test_split(x_data, y_data, 
test_size=0.15, random_state=1)
lr=LinearRegression()
lr.fit(x_train[['horsepower']], y_train)
h=lr.score(x_train[['horsepower']], y_train).mean()
h2=lr.score(x_test[['horsepower']], y_test).mean()
print(h,h2)

1 Ответ

0 голосов
/ 09 января 2020

Похоже, вы используете scikit-learn. Если это так, вы можете использовать r2_score metri c.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...