Как найти интересующий ген в наборе данных и распечатать все значения - PullRequest
0 голосов
/ 13 апреля 2020

У меня есть набор данных, который выглядит следующим образом:

Gene       baseMean  log2FoldChange  lfcSE        stat           pvalue       padj

7SK         30.492  -0.892099279    0.4798019   -0.917210735    0.813808009  0.62064135

A1BG        2.8389  -0.916542309    0.5080946   -0.032557531    0.854027437  NA

A1BG-AS1    19.2657 -0.734784397    0.6184409   -0.056245298    0.355146396  0.976130671

, затем у меня есть еще один список, в котором у меня есть все имена моих генов, представляющих интерес, которые записаны в одном столбце:

Gene (e.g)
7Sk
ABL2
BMP

Итак, теперь мой вопрос: как мне извлечь все столбцы со всеми значениями, присутствующими в наборе данных, если у меня есть точное совпадение между геном, представляющим интерес, и генами в наборе данных?

Спасибо в заранее !!

1 Ответ

0 голосов
/ 14 апреля 2020

Реализация R:

dat1[dat1$Gene %in% dat2$Gene,]
#   Gene baseMean log2FoldChange     lfcSE       stat   pvalue      padj
# 1  7SK   30.492     -0.8920993 0.4798019 -0.9172107 0.813808 0.6206413

merge(dat1, dat2, by = "Gene", all = FALSE)
#   Gene baseMean log2FoldChange     lfcSE       stat   pvalue      padj
# 1  7SK   30.492     -0.8920993 0.4798019 -0.9172107 0.813808 0.6206413

Данные:

dat1 <- read.table(header=TRUE, stringsAsFactors=FALSE, text="
Gene       baseMean  log2FoldChange  lfcSE        stat           pvalue       padj
7SK         30.492  -0.892099279    0.4798019   -0.917210735    0.813808009  0.62064135
A1BG        2.8389  -0.916542309    0.5080946   -0.032557531    0.854027437  NA
A1BG-AS1    19.2657 -0.734784397    0.6184409   -0.056245298    0.355146396  0.976130671")

dat2 <- read.table(header=TRUE, stringsAsFactors=FALSE, text="
Gene
7SK
ABL2
BMP")
# changed "7Sk" to "7SK" to create a match
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...