Question

У меня большой список генов, для которых я хочу найти гомологи.

У меня также есть большой фрейм данных с потенциальными гомологами. Десятый столбец этого Dataframe наследует число, описывающее примерку. Чем больше число, тем лучше.

Я пытаюсь перебрать этот большой список генов.

Для каждого уникального гена в списке я хочу выбрать наиболее подходящий ген гомолога.

Выходными данными должен быть кадр данных с одной строкой на ген, описывающий наилучший гомолог.

Peter · Answer 1 · 11 июня 2019

Решение Tidyverse, при условии, что у вас есть столбец с gene_id на ген, а соответствующий показатель находится в столбце с именем score:

library(tidyverse)

df %>% group_by(gene_id) %>% filter(score == max(score)) %>% ungroup()

Перебирая большой список, находя наиболее подходящий гомолог к гену

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Перебирая большой список, находя наиболее подходящий гомолог к ​​гену

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы

Перебирая большой список, находя наиболее подходящий гомолог к гену