Question

программа:

import pandas as pd

ds=pd.read_csv('Animals.csv')

x=ds.iloc[:,1].values
y=ds.iloc[:,2].values

from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=0)
x_train = x_train.reshape(-1, 1)
y_train = y_train.reshape(-1,1)

from sklearn.linear_model import LinearRegression as lr
reg=lr()
reg.fit(x_train,y_train)

y_pred=reg.predict(x_test)

y_pred = array([[433.34494686],
                [433.20384407],
                [418.6791427 ],
                [433.34789435],
                [407.49640802],
                [432.25311216]])

y_test = array([[ 119.5],
                [ 157. ],
                [5712. ],
                [  56. ],
                [  50. ],
                [ 680. ]])

прогноз не идеален, почему?это какая-то проблема с набором данных или что это может быть?я новичок в машинном обучении, спасибо заранее

yatu · Answer 1 · 23 ноября 2018

Ну, это действительно зависит от того, что вы пытаетесь предсказать, и от того, есть ли у вас хорошие предсказатели.Поэтому, даже если вы просто пытаетесь использовать LR, если ваша целевая переменная объясняется функциями, вы должны получить разумные метрики точности.

Глядя на свои y_test, вам следует рассмотреть возможность удаления выбросов, что, вероятно, улучшитточность модели.

Вы также можете попробовать использовать более эффективные регрессоры, такие как RandomForestRegressor или SupportVectorRegressor .

линейная регрессия

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

линейная регрессия

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов