ТЛ; др
Вы можете получить доверительные интервалы для теста Манна-Уитни-Уилкоксона, указав conf.int=TRUE
.
Не верьте всему, что читаете в Интернете ...
-
- Если под «подтвердить» вы имеете в виду «убедиться в правильности вычислений», вам не нужно перепроверять, сверяясь с исходными таблицами; р-значения должно быть достаточно, чтобы решить, можете ли вы отклонить H0 или нет. Вы можете доверять R для стандартных, широко используемых статистических методов. (Я также покажу ниже, как повторить вычисления с реализацией, отличной от пакета
coin
, который является почти независимой проверкой.)
- если под «подтвердить» вы имеете в виду «принять нулевую гипотезу», пожалуйста, не делайте этого ; это фундаментальное нарушение статистической теории, которая гласит, что вы можете отклонить нулевую гипотезу, но вы никогда не сможете принять нулевую гипотезу Широкие доверительные интервалы и значения p, превышающие заданное пороговое значение, свидетельствуют о том, что заключение является неопределенным (мы не можем быть уверены, является ли значение null или альтернатива истинным), а не то, что null является истинным. Заключительный текст упомянутого поста в блоге («мы делаем вывод, приняв гипотезу о равенстве средних значений H0») статистически неверен .
Лучший способ интерпретировать неопределенность - это посмотреть на доверительные интервалы. Вы можете вычислить их для теста Уилкоксона: от ?wilcox.test
:
... (если аргумент "conf.int" является истинным [и выполняется тест с двумя выборками]), непараметрический
доверительный интервал и оценщик для ... разницы параметров местоположения
‘X-y’ вычисляется.
> a = c(6, 8, 2, 4, 4, 5)
> b = c(7, 10, 4, 3, 5, 6)
> wilcox.test(b,a, conf.int=TRUE, correct=FALSE)
data: b and a
W = 22, p-value = 0.5174
alternative hypothesis: true location shift is not equal to 0
95 percent confidence interval:
-1.999975 4.000016
sample estimates:
difference in location
0.9999395
Высокое значение p (0,5174) говорит о том, что мы действительно не можем определить, имеют ли значения в a
или b
значительно разные ранги. difference in location
дает нам оценочную разницу между срединными рангами, а доверительный интервал дает доверительный интервал для этой разницы. В этом случае для размера выборки 12 предполагаемая разница в рангах равна 1 (группа b имеет несколько более высокие ранги, чем группа a), а доверительный интервал равен (-2, 4) (данные соответствуют группе b, имеющей немного ниже или намного выше, чем в группе а). По общему признанию довольно трудно интерпретировать материальное значение этих значений - это один из недостатков ранговых непараметрических тестов ...
Можно предположить, что значение p, вычисленное с помощью wilcox.test()
, является разумным обобщением свидетельства против нулевой гипотезы; нет необходимости искать диапазоны в таблицах. Если вас беспокоит wilcox.test()
в базе R, вы можете попробовать wilcox_test()
из пакета coin
:
dd <- data.frame(f=rep(c("a","b"),each=6),x=c(a,b))
wilcox_test(x~f,data=dd,conf.int=TRUE) ## asymptotic test
, который дает почти идентичные результаты для wilcox.test()
и
wilcox_test(x~f,data=dd,conf.int=TRUE, distribution="exact")
, который дает немного другое значение p, но по существу те же самые доверительные интервалы.
только исторический интерес
Что касается таблиц: я нашел их в Google books , выполнив поиск Google Scholar с author:katti author:wilcox
. Там вы можете прочитать описание того, как они были вычислены; это не было бы невозможно воспроизвести, но это кажется ненужным, так как значения p и доверительные интервалы доступны с помощью других методов. Покопавшись, вы найдете это:
![enter image description here](https://i.stack.imgur.com/Jrqp4.png)
Число 0,0206 в красном поле указывает на то, что интервал (26,52) соответствует одностороннему p-значению 0,0206 (2-хвост = 0,0412); это самое близкое, что вы можете получить с дискретным диапазоном. Следующий ближайший диапазон указан в строке ниже [(27,51), односторонний р = 0,0325, двусторонний = 0,065]. В 21-м веке вам никогда не придется делать эту процедуру.