Огромное число при расчете ошибки прогнозов - PullRequest
0 голосов
/ 12 июня 2019

Я построил модель множественной линейной регрессии.Мои прогнозные и тестовые значения выглядят следующим образом: Я хочу рассчитать процент ошибок.Но в этом фрагменте кода есть огромные числа:

from sklearn import metrics
print('Mean Absolute Error:', metrics.mean_absolute_error(y_test, y_pred))  

Вывод:

Mean Absolute Error: 137610.86451426445

Что мне теперь делать?

1 Ответ

2 голосов
/ 12 июня 2019

В общем, при выполнении регрессии мы нормализуем данные , подаваемые в модель.Это улучшает предсказания и позволяет избежать фактического взрыва градиентов.

См. здесь для получения дополнительной информации.

Вы можете выполнить нормализацию простым способом, используя

x_new = x - x.min() / ( x.max() - x.min() )

Где x - это выборка из набора данных, x.min() возвращает минимальное значение из набора данных, а x.max() возвращает максимальное значение из данных.x_new - нормализованное значение от 0 до 1.

Следовательно, вы получаете значения, которые принадлежат интервалу [ 0 , 1 ].

Кроме того, мы получаем меньшие значения для функций потерь, таких как MAE и MSE.Градиенты не взрываются или имеют огромные значения.Обучение проходит гладко.

Совет:

Также читайте о стандартизации данных. Стандартизация против нормализации может быть отличным чтением.Может быть, вы можете прочитать это .

...