Какие пакеты R доступны для двоичных данных, которые являются коррелированными и кластеризованными? - PullRequest
1 голос
/ 02 февраля 2010

Сейчас я работаю над проектом, в отличие от всего, что я делал раньше. У меня есть два теста с бинарными результатами, которые будут применены к одному и тому же образцу, взятому из кластерной популяции (то есть некоторые субъекты будут из одной семьи). Я хотел бы сравнить пропорции положительных результатов теста, но кластеризация делает тест Мак-Немара неуместным, поэтому я изучал альтернативные подходы. Похоже, что двумя основными путями являются: 1) альтернативы Макнемара, скорректированные на кластеризацию, по Рао и Скотту (1992), Элиасиву и Доннеру (1991) и Обуховскому (1998), и 2) GEE.

Вам известны какие-либо реализации линии Рао-Обуховского в R (или, я полагаю, SAS)? GEE легко найти, но у вас был положительный или отрицательный опыт с какими-то конкретными пакетами? Есть ли другой способ анализа этих данных, который я полностью упускаю?

Заранее спасибо за помощь - дайте мне знать, если понадобятся какие-либо разъяснения.

Ответы [ 4 ]

3 голосов
/ 02 февраля 2010

Вы всегда можете просто использовать кластерную загрузку. Повторная выборка из семей, которые, по вашему мнению, являются независимыми. То есть держите семьи вместе, когда вы будете пересматривать. Вычислить p2 - p1 для каждого образца. Примерно после 1000 итераций вычислите верхний и нижний 2,5% квантили. Это даст вам начальный 95% доверительный интервал. В качестве альтернативы вычислите долю выборок выше нуля, или какова бы ни была ваша гипотеза. Процедура должна обладать хорошими, довольно хорошими свойствами, если количество семей не небольшое.

Вероятно, проще всего сделать это вручную в R, а не полагаться на какой-либо пакет.

2 голосов
/ 06 мая 2011

Вы уже проверили пакет CorrBin в R?
Для анализа коррелированных двоичных данных есть статья под названием: Использование пакета CorrBin для непараметрического анализа коррелированные двоичные данные по Сабо, они включают в себя Рао-Скотта, стохастическое упорядочение и три версии теста на основе GEE.

2 голосов
/ 03 февраля 2010

Проверьте пакет survey: он разработан для учета корреляций, вызванных кластерной выборкой.

1 голос
/ 26 октября 2016

Пакет clust.bin.pair для кластеризованных двоичных данных согласованных пар недавно был опубликован в CRAN.

Содержит реализации Eliasziw and Donner (1991) и Obuchowski (1998), а также два более поздних теста в том же семействе Durkalski (2003) и Yang (2010).

...