Визуализация рассеянного графика: как раскрасить несколько генов в рассеянный график? - PullRequest
1 голос
/ 13 марта 2020

Я попытался построить основную диаграмму рассеяния c с R, используя данные о генной экспрессии.

#import data: 

oldmice <- read.table("oldmice.txt", header = TRUE)
youngmice <- read.table("youngmice.txt", header = TRUE)

Импортированные данные содержат: формат одинаков для обоих импортированных данных, но MGE имеет разные значения.

 gene   MGE
Sox17   -6.74193774617653   
Mrpl15  -0.212567471203473  
Lypla1  -0.711251006455475  
and so on.. 

Сделан базовый c сюжет вулкана с использованием: youngmice $ MGE против oldmice $ MGE

plot(oldmice$MGE, youngmice$MGE, main="old vs young mice!!",
     xlab="oldmice$MGE ", ylab="youngmice$MGE ", pch=19)

Мой вопрос состоит в том, как раскрасить «гены», которые в множественных списках_списков, в oldmice $ MGE, youngmice $ MGE? (который должен пометить единственный множественный_генный_лист, который находится в множественных_гени-списках, в oldmice $ MGE, youngmice $ MGE)

Вот мой множественный_генный_лист

multiple_gene_list <- read.table("multiple_gene_list.txt", header = TRUE)
multiple_gene_list  <- as.vector(multiple_gene_list )

множественный_генный_лист содержит:

gene
Six6
Arl2
Tmem74B
Rab9B
Rasgef1B
Ccne1
Apln
Spag7
C17Orf59
Krtap4-4

И моя цель - пометить только множественный_генный_лист в oldmice $ MGE, youngmice $ MGE. Я также попробовал следующий код, но не смог!

with(subset(ASC_oldmice_exprs, ASC_oldmice_exprs$gene %in%  multiple_gene_list$gene), points(ASC_youngmice_exprs$MGE, pch=20, col="red"))

Спасибо!

1 Ответ

0 голосов
/ 14 марта 2020

Давайте получим некоторые данные:

multiple_gene_list =structure(list(gene = structure(c(8L, 2L, 10L, 6L, 7L, 4L, 1L, 
9L, 3L, 5L), .Label = c("Apln", "Arl2", "C17Orf59", "Ccne1", 
"Krtap4-4", "Rab9B", "Rasgef1B", "Six6", "Spag7", "Tmem74B"), 
class = "factor")), class = "data.frame", row.names = c(NA, 
-10L))

set.seed(111)

oldmice = data.frame(
gene=c("Six6","Arl2","Tmem74B",letters[1:10]),
MGE=runif(13))

youngmice = data.frame(
gene=c("Six6","Arl2","Tmem74B",letters[1:10]),
MGE=runif(13))

Есть 3 перекрытия, и мы определяем цвета, такие как:

COLS = ifelse(oldmice$gene %in%  multiple_gene_list$gene,
"turquoise","orange")

И график:

plot(oldmice$MGE, youngmice$MGE, main="old vs young mice!!",
     xlab="oldmice$MGE ", ylab="youngmice$MGE ", pch=19,col=COLS)

sel = oldmice$gene %in%  multiple_gene_list$gene
text(x=oldmice$MGE[sel]+0.01,
y=youngmice$MGE[sel]+0.01,
oldmice$gene[sel])

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...