Это довольно сложно.Допустим, у меня есть, например, первый набор данных df
:
sample id name
1 ID200,ID300,ID299 first
2 ID2,ID123 second
3 ID90 third
и второй набор данных df_1
:
ids condition
ID200 y
ID300 n
ID299 n
ID2 y
ID123 y
ID90 n
Мне нужно отфильтровать из первого набора данныхвсе строки, в которых все значения идентификатора удовлетворяют условию во второй таблице, например y
.Таким образом, фильтрация в этом примере должна дать:
sample id name
2 ID2,ID123 second
Я думал использовать что-то вроде:
new_df = df %>%
filter(grepl('ID', id), df_1$condition == 'y')
Но, очевидно, мне нужно что-то другое, можете ли вы дать мне несколько подсказок?
Редактировать: Как я уже сказал в комментарии, что произойдет, если у меня есть столбец ID df, заполненный другим текстом, как это?
sample id name
1 ID = ID200,ID300,ID299,abcd first
2 ID = ID2,ID123, dfg second
3 ID = ID90, text third