Я использую набор данных радужной оболочки модуля sklearn, и я просто делю эти данные на поезд и тестирую, как это
x_train,x_test,y_train,y_test=train_test_split(x_input,y_target, test_size=0.2)
, а затем использую модель лайнера для подбора данных:
lr= LinearRegression()
lr.fit(x_train,y_train)
output
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)
затем прогнозируем
y_hat=lr.predict(x_train)
А затем я просто строю данные y_train, y_hat, используя этот код:
plt.scatter(y_train,y_hat,c="orange")
plt.xlabel('Target (y_train)',size=18)
plt.ylabel('Prediction (y_hat)',size=18)
OutPut :( Но я не знаю, что означают эти построенные данные ..)