Как создать все возможные пары внутри столбца в наборе данных в R? - PullRequest
0 голосов
/ 28 июня 2019

У меня есть 2 столбца в таблице, которые представляют собой идентификаторы и соответствующие им последовательности (т. Е. TCGATCGA).Я хочу сгруппировать эту таблицу по идентификаторам, а затем сгенерировать все возможные пары последовательностей в каждой группе.

В части группировки я использую df%>% group_by (идентификаторы), но у меня возникают проблемы сгенерация всех возможных пар последовательности.

Какая функция будет полезна для генерации этих комбинаций, предпочтительно без необходимости вручную вводить последовательности, потому что у меня более 1000?Конечная цель генерации этих пар состоит в том, чтобы иметь возможность проверить сходство между каждой из последовательностей.

1 Ответ

1 голос
/ 29 июня 2019

Вы можете просто использовать расширенную сетку для того же столбца (вектора)?

x <- c(1,2,3,4,5,6)
expand.grid(x, x)

Если вы не хотите возвращать идентичные идентификаторы и повторение:

t(combn(x, 2))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...