После запуска линейной регрессии на моем наборе данных, мой RMSE приходит 1109.181 - PullRequest
0 голосов
/ 06 июня 2019

Я выполняю линейную регрессию на наборе лекарственных данных.

[columns:'Medicine_ID','Counterfeit_Weight','DistArea_ID','Active_Since','Medicine_MRP','Medicine_Type','SidEffect_Level','Availability_rating','Area_Type','Area_City_Type','Area_dist_level','Counterfeit_Sales]

После завершения части очистки данных я пытаюсь запустить линейную регрессию (как я предсказывал Counterfeit_sales). Но мой RMSE выходит "1109.18". Пожалуйста, посоветуйте мне, что пошло не так?

from sklearn.model_selection import train_test_split
train,test=train_test_split(cf_train,random_state=123,test_size=0.2)
x_train=train.drop(["Medicine_ID","Counterfeit_Sales"],1)
y_train=train["Counterfeit_Sales"]
x_test=train.drop(["Medicine_ID","Counterfeit_Sales"],1)
y_test=train["Counterfeit_Sales"]

from sklearn.linear_model import LinearRegression
lm=LinearRegression()
p_test=lm.predict(x_test)
residual=p_test-y_test
rmse=np.sqrt(np.dot(residual,residual)/len(p_test))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...