тест на разницу средств возвращает неверный результат - PullRequest
0 голосов
/ 08 января 2020

Я использую пример руководства по R-intro:

A = c(79.98, 80.04, 80.02, 80.04, 80.03, 80.03, 80.04, 79.97, 80.05, 80.03, 80.02, 80.00, 80.02)
B = c(80.02, 79.94, 79.98, 79.97, 79.97, 80.03, 79.95, 79.97)
t.test(A, B)

, которое дает следующий результат:

Welch Two Sample t-test

data:  A and B
t = 3.2499, df = 12.027, p-value = 0.006939
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.01385526 0.07018320
sample estimates:
mean of x mean of y 
 80.02077  79.97875 

Вопрос в том, является ли разница средних содержится в доверительном интервале (80,02077-79,97875 = 0,04202 и 0,01385526 <0,04202 <0,07018320), почему он приходит к выводу, что альтернативная гипотеза верна, а не нулевая гипотеза верна? </p>

1 Ответ

3 голосов
/ 08 января 2020

Я думаю, что это проблема языка / интерпретации. Вы интерпретируете

альтернативную гипотезу: истинная разница в средних не равна 0

как

Альтернативная гипотеза верна. Разница в средних не равна 0

, а не (как предполагалось)

Альтернативная гипотеза: «истинная разница в средних не равна 0»

(Согласно строгой логике частых сообщений c мы бы никогда не пришли бы к выводу, что "альтернативная гипотеза верна", только что мы можем отвергнуть нулевую гипотезу.)

Чтобы оценить выводы теста, вы должны взглянуть на 95% доверительный интервал (0,01385526, 0,07018320) и / или значение p (0,0069). Процедура, реализованная в R, не , а соответствует стилю «Неймана-Пирсона», где вы предварительно задаете альфа-уровень и дихотомизируете результат в «отклонить нулевую гипотезу» или «не отклонить нулевую гипотезу». Если вы хотите сделать это, вы можете просто посмотреть на значение p или, если вы хотите, чтобы R сделал это для вас,

alpha <- 0.05  ## or whatever your preferred cutoff is
t_result <- t.test(A,B)
t_result$p.value<alpha ## TRUE (reject null hypothesis)

Более того, ваша интерпретация доверительного интервала неверна. Вы должны посмотреть, включает ли доверительный интервал ноль ; оно всегда будет сосредоточено на наблюдаемой разнице (таким образом, наблюдаемая разница будет всегда включаться в 95% ДИ).

...