Линейная регрессия включает в себя минимизацию среднеквадратичной ошибки (Q), чтобы найти наиболее подходящий наклон (a) и точку пересечения (b). То есть Q будет минимизирован при значениях a и b, для которых ∂Q / ∂a = 0 и ∂Q / ∂b = 0.
Сумма остатков и, следовательно, среднее всегда равно ноль для данных, по которым вы регрессировали. Это одно из двух вышеупомянутых условий линейной регрессии.
Итак, если вы не проверяете остаточное среднее для данных, не используемых в обучении, кажется, есть некоторая ошибка в процедуре линейной регрессии, которую вы использовали.
Подробное подтверждение доступно здесь: http://seismo.berkeley.edu/~kirchner/eps_120/Toolkits/Toolkit_10.pdf