Как узнать, работает ли модель линейной регрессии? - PullRequest
0 голосов
/ 08 ноября 2019

Я работаю над набором данных о поведении при голосовании. Я должен провести регрессию OLS, чтобы оценить влияние разногласий на аборт. Я впервые играю с данными. У меня есть две зависимые переменные. Я использую научную модель линейной регрессии.

После запуска модели у меня есть: coefffieciet значения: 0.118221, 0.330132

Фактическое значение: 32105, 34157, 44165, 13890, 53047, 0.140918

Прогнозируемые значения: 0.47105, 1.037624, 0.471050, 0.919403

Средняя абсолютная ошибка: 0.5163281569302932

Средняя квадратическая ошибка: 0.47136062479402246

Средняя квадратная ошибка: 0.6865570805068013

1014, если эти значенияверны. Как узнать, верны ли значения? И если не правильно, какие параметры должны быть изменены?

Мой код:

X = df[['Deviation from Partisanship','Democrat']] 
Y = df['Disagreement with Party on Social Issues']
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=0)
regressor = LinearRegression()  
regressor.fit(X_train, y_train)
coeff_df = pd.DataFrame(regressor.coef_, X.columns, columns=['Coefficient']) 
y_pred = regressor.predict(X_test)
df1 = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})
df1.head()
print('Mean Absolute Error:', metrics.mean_absolute_error(y_test, y_pred))  
print('Mean Squared Error:', metrics.mean_squared_error(y_test, y_pred))  
print('Root Mean Squared Error:', np.sqrt(metrics.mean_squared_error(y_test, y_pred)))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...