Я выполняю линейную регрессию на наборе лекарственных данных.
[columns:'Medicine_ID','Counterfeit_Weight','DistArea_ID','Active_Since','Medicine_MRP','Medicine_Type','SidEffect_Level','Availability_rating','Area_Type','Area_City_Type','Area_dist_level','Counterfeit_Sales]
После завершения части очистки данных я пытаюсь запустить линейную регрессию (как я предсказывал Counterfeit_sales). Но мой RMSE выходит "1109.18". Пожалуйста, посоветуйте мне, что пошло не так?
from sklearn.model_selection import train_test_split
train,test=train_test_split(cf_train,random_state=123,test_size=0.2)
x_train=train.drop(["Medicine_ID","Counterfeit_Sales"],1)
y_train=train["Counterfeit_Sales"]
x_test=train.drop(["Medicine_ID","Counterfeit_Sales"],1)
y_test=train["Counterfeit_Sales"]
from sklearn.linear_model import LinearRegression
lm=LinearRegression()
p_test=lm.predict(x_test)
residual=p_test-y_test
rmse=np.sqrt(np.dot(residual,residual)/len(p_test))