R: Переменные длины различаются в тесте Уилкоксона - PullRequest
0 голосов
/ 27 марта 2020

Попытка выяснить, есть ли значительная разница в DAPI между лечением ДМСО и лечением EPZ. В моем наборе данных есть три переменные, и в каждой группе лечения имеется разное количество людей. Вот данные, которые я составил, чтобы дать картину:

  • Лечение DAPI DAPO DAPU
  • DMSO 20 30 40
  • DMSO 24 26 42
  • DMSO 23 24 39
  • EPZ 0,5 мкм 10 25 22 * ​​1012 *
  • EPZ 0,5 мкм 12 24 22 * ​​1014 *
  • EPZ 0,5 мкм 14 24 30
  • EPZ 0,5 мкм 20 19 32

(извините, я не знаю, как отформатировать таблицу в стеке),

После импорта набора данных я сделал это: EPZDMSO<-EPZdata[which(EPZdata$Treatment=="DMSO"),] EPZ0.5uM<-EPZdata[which(EPZdata$Treatment=="EPZ0.5uM"),]

Пытался использовать wilcox.text: wilcox.test(EPZDMSO$DAPI~EPZ0.5uM$DAPI,data=EPZdata,mu=0,alt="two.sided",conf.int=T,conf.level=0.95,paired=FALSE,exact=T,correct=T)

Но получите это сообщение об ошибке: Error in model.frame.default(formula = EPZDMSO$DAPI ~ EPZ0.5uM$DAPI, data = EPZdata) : variable lengths differ (found for 'EPZ0.5uM$DAPI')

Нужно ли исправлять несбалансированные данные?

Пожалуйста, помогите

(и, пожалуйста, оставайтесь дома и будьте в безопасности # Covid-19)

1 Ответ

1 голос
/ 27 марта 2020

Вы были близки, просто нужно поместить в столбец DAPI.

Вот справочная страница, help(wilcox.test).

wilcox.test (x, y = NULL, alternative = c ("two.sided", "less", «больше»), mu = 0, парный = FALSE, точный = NULL, правильный = TRUE, conf.int = FALSE, conf.level = 0.95, ...)

Аргументы

x цифра c вектор значений данных. Нечетные (например, бесконечные или отсутствующие) значения будут опущены.

y необязательный числовой c вектор значений данных: как и для x, конечные значения будут опущены.

Таким образом, для сравнения двух групп с wilcox.test, x и y должны быть векторы данных.

wilcox.test(x = EPZDMSO$DAPI, y = EPZ0.5uM$DAPI,
            mu=0, alt="two.sided", conf.int=T, conf.level=0.95,
            paired=FALSE, exact=T, correct=T)

    Wilcoxon rank sum test with continuity correction

data:  EPZDMSO$DAPI and EPZ0.5uM$DAPI
W = 11.5, p-value = 0.07446
alternative hypothesis: true location shift is not equal to 0
95 percent confidence interval:
  0 14
sample estimates:
difference in location 
              9.497565 

Данные

EPZdata <- structure(list(Treatment = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 
2L), .Label = c("DMSO", "EPZ0.5uM"), class = "factor"), DAPI = c(20L, 
24L, 23L, 10L, 12L, 14L, 20L), DAPO = c(30L, 26L, 24L, 25L, 24L, 
24L, 19L), DAPU = c(40L, 42L, 39L, 22L, 22L, 30L, 32L)), class = "data.frame", row.names = c(NA, 
-7L))
EPZDMSO<-EPZdata[which(EPZdata$Treatment=="DMSO"),]
EPZ0.5uM<-EPZdata[which(EPZdata$Treatment=="EPZ0.5uM"),]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...