Уместно ли вычислить r-квадрат устойчивой регрессии, используя rlm - PullRequest
0 голосов
/ 05 февраля 2020

Я использую функцию rlm из MASS для выполнения устойчивой регрессии. В отличие от lm, функция итога не возвращает значение для r-квадрата.

Поэтому уместно рассчитать это, используя 1 - sum(residual^2)/(sum((Y-mean(Y))^2)?

(извинения за уравнение, я не мог понять, как напиши это лучше отформатировано)

1 Ответ

0 голосов
/ 05 февраля 2020

Робастная линейная регрессия (rlm) используется вместо линейной регрессии (lm), когда данные имеют много выбросов; также он может быть использован для обнаружения влиятельных наблюдений. Робастная регрессия использует итеративно переоцененные наименьшие квадраты (IRLS) для оценки максимального правдоподобия (MLE), тогда как линейная регрессия использует ординарные наименьшие квадраты (OLS), что является причиной того, что R-квадрат (коэффициент детерминации) возвращается lm (), а не rlm ().

Теперь, когда мы подошли к уместности, это не является подходящей мерой для оценки пригодности для устойчивой регрессии, поскольку она включает вычисление квадрата потерь = сумма (остаток ^ 2) = сумма (прогнозируемые значения, наблюдаемые значения) ^ 2 в формула для г-квадрат. Поскольку устойчивая регрессия включает в себя работу с данными, содержащими много выбросов, метри c приведет к абсурдному значению из-за больших значений, полученных из остатков для больших выбросов, а также в квадрате!
Это причина, по которой абсолютные потери = (предсказать -актуальный) используется для оценки соответствия, когда участвуют выбросы.

Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...