Как сделать lm () выходным тестом в R - PullRequest
0 голосов
/ 27 марта 2019

Мне рассказывали и видели примеры, когда линейная модель и t-тест - это в основном один и тот же тест, просто что t-тест представляет собой специализированную линейную модель с фиктивными предикторами.Есть ли способ получить выходные данные lm для вывода тех же значений t, значений p, доверительных интервалов и стандартной ошибки, что и для нормальной функции t.test в r, где значение по умолчанию для аргумента var.equal равно FALSE?

Например, сейчас выходы lm и t.test сейчас разные

data("mtcars")
#these outputs below give me different values 
summary(lm(mpg ~ am, mtcars))
t.test(mpg ~ am, mtcars)

Я хочу, чтобы lm имел те же значения, что и функция t.test., который является t-тестом Уэлча.Как бы я это сделал?

Ответы [ 2 ]

2 голосов
/ 27 марта 2019

Во-первых, существует отличный пост о CrossValidated Как регрессия, t-критерий и ANOVA - все версии общей линейной модели? , которая дает много справочной информации о взаимосвязи между t -тестом, линейной регрессией и ANOVA.

По сути, значение p из теста t соответствует значению p параметра наклона в линейной модели.

В вашем случае нужно сравнить

t.test(mpg ~ am, mtcars, alternative = "two.sided", var.equal = T)
#
#   Two Sample t-test
#
#data:  mpg by am
#t = -4.1061, df = 30, p-value = 0.000285
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
# -10.84837  -3.64151
#sample estimates:
#mean in group 0 mean in group 1
#       17.14737        24.39231

fit <- lm(mpg ~ as.factor(am), mtcars)
summary(fit)
#
#Call:
#lm(formula = mpg ~ as.factor(am), data = mtcars)
#
#Residuals:
#    Min      1Q  Median      3Q     Max
#-9.3923 -3.0923 -0.2974  3.2439  9.5077
#
#Coefficients:
#               Estimate Std. Error t value Pr(>|t|)
#(Intercept)      17.147      1.125  15.247 1.13e-15 ***
#as.factor(am)1    7.245      1.764   4.106 0.000285 ***
#---
#Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
#Residual standard error: 4.902 on 30 degrees of freedom
#Multiple R-squared:  0.3598,   Adjusted R-squared:  0.3385
#F-statistic: 16.86 on 1 and 30 DF,  p-value: 0.000285

Обратите внимание, что значения p совпадают.

Два комментария:

  1. as.factor(am) превращает am в категориальную переменную
  2. Чтобы соответствовать предположениям линейной модели (где погрешность epsilon ~ N(0, sigma^2)), нам нужно использовать t.test с var.equal = T, который предполагает, что дисперсия одинакова для измерений из обеих групп.
  3. Разница в знаке значения t обусловлена ​​различным определением контрольного уровня "категоризированного" am.

Чтобы получить те же групповые средства в линейной модели, мы можем удалить перехват

lm(mpg ~ as.factor(am) - 1, mtcars)
#
#Call:
#lm(formula = mpg ~ as.factor(am) - 1, data = mtcars)
#
#Coefficients:
#as.factor(am)0  as.factor(am)1
#         17.15           24.39
0 голосов
/ 27 марта 2019

Предположение о линейной регрессии состоит в том, что остатки обычно распределяются со средним значением 0 и постоянной дисперсией.Следовательно, ваши результаты t.test и регрессии будут иметь согласованные результаты, только если вы предполагаете, что отклонения равны.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...