Перебирая большой список, находя наиболее подходящий гомолог к ​​гену - PullRequest
0 голосов
/ 11 июня 2019

У меня большой список генов, для которых я хочу найти гомологи.

У меня также есть большой фрейм данных с потенциальными гомологами. Десятый столбец этого Dataframe наследует число, описывающее примерку. Чем больше число, тем лучше.

Я пытаюсь перебрать этот большой список генов.

Для каждого уникального гена в списке я хочу выбрать наиболее подходящий ген гомолога.

Выходными данными должен быть кадр данных с одной строкой на ген, описывающий наилучший гомолог.

1 Ответ

0 голосов
/ 11 июня 2019

Решение Tidyverse, при условии, что у вас есть столбец с gene_id на ген, а соответствующий показатель находится в столбце с именем score:

library(tidyverse)

df %>% group_by(gene_id) %>% filter(score == max(score)) %>% ungroup()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...