Автоматизируйте U-тест Манна Уитни для огромного набора данных - PullRequest
0 голосов
/ 16 мая 2019

Я новичок в R, и я заранее прошу прощения, если вопрос слишком тривиален для вас, люди, но я нахожусь во всей моей голове.

Пытаясь выучить R, я столкнулся сс проблемой создания повторяющегося цикла для выполнения тестовой группы 1 Манна Уитни U против группы 2 для нескольких переменных, одна за другой.Вот ниже пример.(https://i.redd.it/2c0429k4y3y21.png)

Несмотря на то, что я могу выполнить проверку одной переменной одной переменной, от A до Z, в реальных данных, которые я тестирую, у меня более 10000 переменных, поэтому я должен найти способ 1)автоматизировать тестирование;2) сгенерировать файл, содержащий все полученные p-значения.

Кто-нибудь будет так любезен, чтобы помочь мне с этой задачей?Я более чем готов потратить столько времени, сколько мне нужно, чтобы научиться кодировать на R, но мне нужно немного подтолкнуть это.

Спасибо

1 Ответ

0 голосов
/ 16 мая 2019

Поскольку предоставленные вами данные имели только один факторный уровень, я добавил три "Wildtypes", чтобы код работал.

gen <- structure(list(genotype=structure(c(1L, 1L, 1L, 1L, 1L, 1L),
    .Label=c("Mutant", "Wildtype"), class="factor"), X312=c(0, 0, 9.927911044,
    7.604660497, 0, 8.469434699), X1.Sep=c(9.296165425, 7.994991396, 10.3226941,
    10.59396298, 10.2554214, 7.963356173), X2.Sep=c(12.0207487, 10.92364072,
    11.22504751, 11.2077482, 11.91886469, 11.64801165), X1.Dec=c(0L, 0L, 0L, 0L, 0L,
    0L), X128up=c(8.051389852, 8.437100325, 2.9382856, 9.05631996, 0, 8.993819702),
    X140up=c(7.859521468, 7.638131579, 0, 8.567090791, 8.7672994, 10.219634)),
    row.names=c(NA, 6L), class="data.frame")


gen[1:3, 1] <- factor(rep(2, 3), label="Wildtype")

Как мы можем выполнить U-тест Манна Уитни для одного столбца, например:

# for column 6
wilcox.test(gen[gen$genotype == "Mutant", 6], 
            gen[gen$genotype == "Wildtype", 6], exact=FALSE)$p.val

мы можем выполнить это для всех столбцов, просто зацикливая индексы столбцов (исключая первый), используя sapply(), например, так:

sapply(2:ncol(gen), 
  function(x) {
      wilcox.test(gen[gen$genotype == "Mutant", x], 
                  gen[gen$genotype == "Wildtype", x], exact=FALSE)$p.val
  }
)
# [1] 1.00000 1.00000 1.00000     NaN 0.66252 0.08085
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...