Как интерпретировать предположения о линейной регрессии данных - PullRequest
0 голосов
/ 06 марта 2020

У меня есть набор данных с 3719 наблюдениями с 9 функциями. В этом я выполнил множественную линейную регрессию с выбранными функциями. Я получил диагноз c графиков, таких как:

this

. Из графиков я понял, что между зависимыми и независимыми переменными нет линейности. Отдельные графики дают нелинейный тренд. Но из графика нормального QQ следует нормальное распределение. Я не понял, что имеется в виду под графиками остаточного или кредитного плеча?

Я правильно понимаю? Как интерпретировать эти сюжеты.

1 Ответ

0 голосов
/ 06 марта 2020

Ваши остатки демонстрируют гетероскедастичность (вверху слева), а это означает, что изменчивость вашего результата увеличивается с ростом значений результата. Например, доход против расходов: у более состоятельных людей больше цен на продукты, которые они покупают (они иногда покупают дешевую пищу, а иногда - дорогую), в то время как более бедные люди, как правило, покупают только дешевую пищу.

QQ-график (внизу слева) оценивает нормальность допущения остатков, и я не вижу ничего, чтобы предположить серьезное нарушение. Небольшое отклонение в правом верхнем углу не так серьезно, как ваша проблема гетероскедастичности.

График остатков и левереджа (внизу справа) указывает точки, которые могут оказать большое влияние на ваши результаты в зависимости от расстояния Кука. Это может помочь выявить выбросы в ваших данных, и вы могли бы рассмотреть возможность их исключения перед запуском другой модели (довольно субъективная оценка).

...