Есть ли функция R, чтобы показать все гены, которые я пытаюсь отфильтровать из моего набора данных? - PullRequest
0 голосов
/ 24 мая 2019

Я пытаюсь отфильтровать гены из большого набора данных, и когда я запускаю это, получается меньше генов, чем я ввел.Как я могу получить все гены, которые я фильтрую, чтобы появиться в моем фрейме данных?

df < -read.csv("05.15.19.MT_AdultVInfant.wadjp.csv", header = TRUE, row.names = NULL)
data < -as.data.frame(df % > %
    filter(gene == 'FMO3' | gene == 'MRC2' | gene == 'GPRC5A' | gene == 'ATP1A2' | gene == 'RRAGD' | gene == 'LZTS1' | gene == 'EML1' | gene == 'SYT1' | gene == 'MGAT4A' | gene == 'TEAD2' | gene == 'BRINP1' | gene == 'PLOD1' | gene == 'IRAK3' | gene == 'UNC13D' | gene == 'KCNK10' | gene == 'DOK5' | gene == 'PLCB4' | gene == 'CACNA1F' | gene == 'PTN' | gene == '10orf54' | gene == 'CYP2C18' | gene == 'CPD' | gene == 'ALDH3A1' | gene == 'CHPT1'))

Здесь 24 гена, но на выходе есть только 3. Для этого примера я ожидаю увидеть все 24 гена каквсе они присутствуют в исходном наборе данных.

1 Ответ

0 голосов
/ 24 мая 2019

Мы можем создать вектор имен генов и использовать от %in% до filter

library(dplyr)
out <- df1 %>%
          filter(gene %in% v1)

В tbl_df print только несколько строк.Таким образом, можно либо преобразовать в data.frame

data.frame(out)

, либо изменить параметры print (tibble.print_max) для tibble, чтобы показать больше строк

, где

v1 <- c('FMO3', 'MRC2', 'GPRC5A', ...)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...