Извлечение генов, дифференциально экспрессируемых по критерию Уилкокса - PullRequest
0 голосов
/ 09 января 2019

У меня есть культуры двух типов клеток (NOF и CAF) по отдельности, а также ко-культивировали с опухолью, как на этой картинке.

https://ibb.co/x8Ty1Wz

Если это log cpm этих 4 образцов

> head(onco[,1:4])
             A10       A11        A12        A2
A2M    11.755100 12.145143 12.9787977 12.407221
ABCB11  2.955457  2.278363  0.1229266  1.493507
ABCC2   6.711643  6.974025  0.1229266  7.628936
ABCC6   6.443439  6.094670  6.1389496  7.483394
ABCF1   9.995098 10.045613  9.6627424 10.314842
ABCG2   7.125483  7.448127  6.8669702  8.492895
> 

Я использовал логарифм числа на миллион (cpm) для теста ранговых сумм Крускала-Уоллиса, который говорит, что эти образцы значительно отличаются, как показано ниже;

> NOF1=c(NOF1$`onco$A10`)
> NOF2=c(NOF2$`onco$A11`)
> CAF1=c(CAF1$`onco$A12`)
> CAF2=c(CAF2$`onco$A2`)
> my_data <- data.frame( 
+     group = rep(c("NOF1", "NOF2","CAF1","CAF2"), each = 719),
+     cell_type = c(NOF1,NOF2,  CAF1,CAF2)
+ )

> head((my_data))
  group cell_type
1  NOF1 11.755100
2  NOF1  2.955457
3  NOF1  6.711643
4  NOF1  6.443439
5  NOF1  9.995098
6  NOF1  7.125483
> 

> kruskal.test(cell_type ~ group, data = my_data)

    Kruskal-Wallis rank sum test

data:  cell_type by group
Kruskal-Wallis chi-squared = 22.006, df = 3, p-value = 6.505e-05

> 

Затем я провел парное сравнение, используя критерий ранговой суммы Вилкоксона, чтобы увидеть, какие выборки отличаются друг от друга.

> pairwise.wilcox.test(my_data$cell_type, my_data$group,
+                      p.adjust.method = "BH")

    Pairwise comparisons using Wilcoxon rank sum test 

data:  my_data$cell_type and my_data$group 

     CAF1   CAF2   NOF1  
CAF2 0.0058 -      -     
NOF1 0.2809 4e-05  -     
NOF2 0.6818 0.0016 0.3811

P value adjustment method: BH 
> 

Мой вопрос есть; Как я могу извлечь гены за разницу между каждой парой образцов? Я имею в виду что-то вроде дифференциального выражения под непараметрическим тестом. также я не уверен, правильно ли я использую значения в логах cpm для этого теста

Если возможно, дайте мне руку, чтобы исправить себя и обрести интуицию

Спасибо

...