Всегда ли в модели линейной регрессии необходимо, чтобы остаточное среднее всегда было близко или равным нулю? - PullRequest
0 голосов
/ 11 июля 2020
resid = df['Actual'] - df['Predicted']

resid_mean = resid.mean()

print(resid_mean)

Вывод:

250.8173868583906

Правильно ли предсказывает моя модель значение или нет?

1 Ответ

0 голосов
/ 11 июля 2020

Линейная регрессия включает в себя минимизацию среднеквадратичной ошибки (Q), чтобы найти наиболее подходящий наклон (a) и точку пересечения (b). То есть Q будет минимизирован при значениях a и b, для которых ∂Q / ∂a = 0 и ∂Q / ∂b = 0.

Сумма остатков и, следовательно, среднее всегда равно ноль для данных, по которым вы регрессировали. Это одно из двух вышеупомянутых условий линейной регрессии.

Итак, если вы не проверяете остаточное среднее для данных, не используемых в обучении, кажется, есть некоторая ошибка в процедуре линейной регрессии, которую вы использовали.

Подробное подтверждение доступно здесь: http://seismo.berkeley.edu/~kirchner/eps_120/Toolkits/Toolkit_10.pdf

...