Как получить табличный интервал критерия суммы рангов Уилкоксона-Манна-Уитни - PullRequest
0 голосов
/ 10 сентября 2018

Я читал эту тему на Rbloggers об использовании теста ранговой суммы Уилкоксона: https://www.r -bloggers.com / wilcoxon-mann-whitney-rank-sum-test-test-u-test-u /

Особенно эту часть, здесь я цитирую:

"Мы можем наконец сравнить интервалы, приведенные в таблицах Уилкоксона для независимых выборок. Табличный интервал для двух групп из 6каждая выборка (26, 52) ".

Как я могу получить эти" табличные "значения?
Я понимаю, что они использовали таблицу, в которой значения представлены в соответствии с размером каждой выборки,но мне было интересно, есть ли способ получить их в R.

Это важно, потому что, как я понимаю, пост, как только у вас есть p-значение> 0,05, и поэтому вы не можете отвергнуть нулевую гипотезу H0,Вы можете фактически подтвердить H0, сравнивая «вычисленные» и «табличные» интервалы.

Итак, мне нужны табличные интервалы с использованием R.

1 Ответ

0 голосов
/ 10 сентября 2018

ТЛ; др

  1. Вы можете получить доверительные интервалы для теста Манна-Уитни-Уилкоксона, указав conf.int=TRUE.

  2. Не верьте всему, что читаете в Интернете ...

    • Если под «подтвердить» вы имеете в виду «убедиться в правильности вычислений», вам не нужно перепроверять, сверяясь с исходными таблицами; р-значения должно быть достаточно, чтобы решить, можете ли вы отклонить H0 или нет. Вы можете доверять R для стандартных, широко используемых статистических методов. (Я также покажу ниже, как повторить вычисления с реализацией, отличной от пакета coin, который является почти независимой проверкой.)
    • если под «подтвердить» вы имеете в виду «принять нулевую гипотезу», пожалуйста, не делайте этого ; это фундаментальное нарушение статистической теории, которая гласит, что вы можете отклонить нулевую гипотезу, но вы никогда не сможете принять нулевую гипотезу Широкие доверительные интервалы и значения p, превышающие заданное пороговое значение, свидетельствуют о том, что заключение является неопределенным (мы не можем быть уверены, является ли значение null или альтернатива истинным), а не то, что null является истинным. Заключительный текст упомянутого поста в блоге («мы делаем вывод, приняв гипотезу о равенстве средних значений H0») статистически неверен .

Лучший способ интерпретировать неопределенность - это посмотреть на доверительные интервалы. Вы можете вычислить их для теста Уилкоксона: от ?wilcox.test:

... (если аргумент "conf.int" является истинным [и выполняется тест с двумя выборками]), непараметрический доверительный интервал и оценщик для ... разницы параметров местоположения ‘X-y’ вычисляется.

> a = c(6, 8, 2, 4, 4, 5)
> b = c(7, 10, 4, 3, 5, 6)
> wilcox.test(b,a, conf.int=TRUE, correct=FALSE)
data:  b and a
W = 22, p-value = 0.5174
alternative hypothesis: true location shift is not equal to 0
95 percent confidence interval:
 -1.999975  4.000016
sample estimates:
difference in location 
             0.9999395 

Высокое значение p (0,5174) говорит о том, что мы действительно не можем определить, имеют ли значения в a или b значительно разные ранги. difference in location дает нам оценочную разницу между срединными рангами, а доверительный интервал дает доверительный интервал для этой разницы. В этом случае для размера выборки 12 предполагаемая разница в рангах равна 1 (группа b имеет несколько более высокие ранги, чем группа a), а доверительный интервал равен (-2, 4) (данные соответствуют группе b, имеющей немного ниже или намного выше, чем в группе а). По общему признанию довольно трудно интерпретировать материальное значение этих значений - это один из недостатков ранговых непараметрических тестов ...

Можно предположить, что значение p, вычисленное с помощью wilcox.test(), является разумным обобщением свидетельства против нулевой гипотезы; нет необходимости искать диапазоны в таблицах. Если вас беспокоит wilcox.test() в базе R, вы можете попробовать wilcox_test() из пакета coin:

dd <- data.frame(f=rep(c("a","b"),each=6),x=c(a,b))
wilcox_test(x~f,data=dd,conf.int=TRUE) ## asymptotic test

, который дает почти идентичные результаты для wilcox.test() и

 wilcox_test(x~f,data=dd,conf.int=TRUE, distribution="exact")

, который дает немного другое значение p, но по существу те же самые доверительные интервалы.

только исторический интерес

Что касается таблиц: я нашел их в Google books , выполнив поиск Google Scholar с author:katti author:wilcox. Там вы можете прочитать описание того, как они были вычислены; это не было бы невозможно воспроизвести, но это кажется ненужным, так как значения p и доверительные интервалы доступны с помощью других методов. Покопавшись, вы найдете это:

enter image description here

Число 0,0206 в красном поле указывает на то, что интервал (26,52) соответствует одностороннему p-значению 0,0206 (2-хвост = 0,0412); это самое близкое, что вы можете получить с дискретным диапазоном. Следующий ближайший диапазон указан в строке ниже [(27,51), односторонний р = 0,0325, двусторонний = 0,065]. В 21-м веке вам никогда не придется делать эту процедуру.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...