Как выбрать символы, которые присутствуют в нескольких столбцах данных - PullRequest
0 голосов
/ 28 мая 2019

Я пытаюсь выбрать все символы в этом наборе данных, чтобы сделать фрейм данных только из символа, общего для трех столбцов

Я пытался использовать duplicated () из dyplr, но он будет выбирать дубликаты только из 2 столбцов.

#  UT          MT              HT
ABHD17C       ABCG1       AC005884.1
ABHD4         ABHD17C      AC009234.1
ABO           ABO         AC011933.1
AC009234.1    AC009234.1   AC097724.3
ACSL3        AC025627.9    ABO
ACSL5        AC097724.3    ACTA2
ACSS1        ACP5         ADAMTS15
ACTBP12      ACSS1        ADAMTS20
ACTG1        ACSL5        ADH7
ACTG1P12     ACSS1        AKR1C1
ACTN4        ACTA2        AKR1C2
ADAM19       ADAMTS15     AKR1C4
ADAMTS15     ADAMTS20     ALDH1L2
ADCK3        ADH7         ALDH3A1

В этом примере столбцы должны разделять только «ABO», но в моем наборе более обширных данных выбраны символы, которые находятся не во всех трех столбцах

1 Ответ

1 голос
/ 28 мая 2019

На самом деле, ваши данные также имеют "AC009234.1" и "ADAMTS15" во всех трех столбцах.

intersect(df$UT, intersect(df$MT, df$HT))
[1] "ABO"        "AC009234.1" "ADAMTS15" 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...