Я хочу выполнить анализ остатков, и я знаю, что остатки равны наблюдаемым значениям минус прогнозные. Но я не знаю, должен ли я рассчитывать остатки из тренировочного набора или тестового набора?
Должен ли я использовать это:
import statsmodels.api as sm
# Making predictions
lm = sm.OLS(y_train,X_train).fit()
y_pred = lm.predict(X_train)
resid = y_train - y_pred.to_frame('price')
ИЛИ это:
import statsmodels.api as sm
# Making predictions
lm = sm.OLS(y_train,X_train).fit()
y_pred = lm.predict(X_test)
resid = y_test- y_pred.to_frame('price')