Я новичок ie в python. Я пытаюсь сделать простое предсказание с использованием линейной регрессии. Вот набор данных, с которым я работаю:
serial Tt Tv Nc
90 71675 425595 3171
91 74865 441560 15965
Вот код
#import library
import statsmodels.api as sm
from sklearn import datasets
import numpy as np
import pandas as pd
#dataset
data = pd.read_excel("testtv.xlsx")
#import linear regression
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
#getting dependent variable and independent variable
x=data['Tt']
y=data['Tv']
#prediction
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.1)
lr = LinearRegression()
lr.fit(np.array(x_train).reshape(-1,1),np.array(y_train).reshape(-1,1))
Как я могу напечатать прогнозируемое значение для следующих 7 серий? Я использовал значения x как 'Tt' и значения y 'Tv'. Более того, увеличение test_size = 0.8 дает неверное значение прогноза. Как я могу исправить это?