Я работаю над набором данных о поведении при голосовании. Я должен провести регрессию OLS, чтобы оценить влияние разногласий на аборт. Я впервые играю с данными. У меня есть две зависимые переменные. Я использую научную модель линейной регрессии.
После запуска модели у меня есть: coefffieciet значения: 0.118221, 0.330132
Фактическое значение: 32105, 34157, 44165, 13890, 53047, 0.140918
Прогнозируемые значения: 0.47105, 1.037624, 0.471050, 0.919403
Средняя абсолютная ошибка: 0.5163281569302932
Средняя квадратическая ошибка: 0.47136062479402246
Средняя квадратная ошибка: 0.6865570805068013
1014, если эти значенияверны. Как узнать, верны ли значения? И если не правильно, какие параметры должны быть изменены?
Мой код:
X = df[['Deviation from Partisanship','Democrat']]
Y = df['Disagreement with Party on Social Issues']
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.2, random_state=0)
regressor = LinearRegression()
regressor.fit(X_train, y_train)
coeff_df = pd.DataFrame(regressor.coef_, X.columns, columns=['Coefficient'])
y_pred = regressor.predict(X_test)
df1 = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})
df1.head()
print('Mean Absolute Error:', metrics.mean_absolute_error(y_test, y_pred))
print('Mean Squared Error:', metrics.mean_squared_error(y_test, y_pred))
print('Root Mean Squared Error:', np.sqrt(metrics.mean_squared_error(y_test, y_pred)))