Анализ остаточного нормального вероятностного графика - PullRequest
0 голосов
/ 20 апреля 2019

Это очень простой вопрос. Я хочу проанализировать стандартизированные остатки модели линейной регрессии. Поэтому я сделал график остаточной нормальной вероятности следующим образом:

model = LinearRegression(fit_intercept=True)
x = df.temp
x = np.asarray(x).reshape(-1, 1)
model.fit(x, df.RH)
y_predicted = model.predict(x)
residual = df.RH - y_predicted
residual = (residual - np.mean(residual)) / np.std(residual)

fig, ax = plt.subplots(figsize=(5,5))
fig = plt.title("Normal Probability Plot")
fig = sp.stats.probplot(residual, plot=ax, fit=False, dist='norm')

enter image description here

На этом графике есть некоторые выбросы. Тогда я просто удалил все выбросы из исходных данных и получил те же результаты. Так как же я могу интерпретировать этот сюжет? Могу ли я считать эти точки выбросами? Или я могу предположить, что остатки являются приблизительно линейными, поддерживая условие, что члены ошибки обычно распределены?

...