Таблица Anova из регрессии [r] - PullRequest
       70

Таблица Anova из регрессии [r]

0 голосов
/ 02 августа 2020

Я хотел бы спросить, как лучше понять выходную таблицу anova после вставки линейной модели. Здесь я подготовил пример, о котором я хотел бы спросить:

library(tidyverse)

model1 <- lm(hp ~ wt + qsec + disp, data = mtcars)
model2 <- lm(hp ~ qsec + disp, data = mtcars)
summary(model1)

Y_mean <- mean(mtcars$hp)

summary(aov(model1))

model_help <- lm(hp ~ wt, data = mtcars)
sum((fitted(model_help) - Y_mean)^2)

model_help2 <- lm(hp ~ wt + qsec, data = mtcars)
sum((fitted(model_help2) - Y_mean)^2) - sum((fitted(model_help) - Y_mean)^2)

с помощью команды summary(aov(model1)) мы получаем таблицу, в которой каждый столбец «Sum sq» представляет собой регрессионную сумму квадрата значения после добавления другого регрессора к регрессия.

Я хотел бы спросить, какой НУЛЕВОЙ гипотез проверяется с помощью F-теста в той же таблице? Обычно F-тест используется для проверки совместной значимости - либо общей модели, либо множественных регрессоров, например:

model_anova1 <- lm(hp ~ wt + qsec + disp, data = mtcars)
model_anova2 <- lm(hp ~ wt, data = mtcars)

anova(model_anova1, model_anova2)

Здесь проверяемое значение null задается как: H_ {0}: \ beta qse c = \ beta disp = 0

1 Ответ

0 голосов
/ 06 августа 2020

Здесь сравнивается общее соответствие модели (остаточные суммы квадратов) двух вложенных моделей. То есть общая подгонка более сложной модели (hp ~ wt + qsec + disp) не лучше, чем общая подгонка менее сложной модели (hp ~ wt).

Итак, RSS bigModel - RSS smallModel = 0.

Статистический тест по умолчанию вычисляется для распределения F . Вы можете выбрать другую статистику c, используя для аргумента test одно из следующих значений: "Rao", "LRT", "Chisq", "F", "Cp". В большинстве случаев, вероятно, предпочтительнее использовать тест отношения правдоподобия ("LRT").

Для более общего обсуждения методов сравнения моделей см. Выбор модели .

...