Question

У меня есть 2 столбца в таблице, которые представляют собой идентификаторы и соответствующие им последовательности (т. Е. TCGATCGA).Я хочу сгруппировать эту таблицу по идентификаторам, а затем сгенерировать все возможные пары последовательностей в каждой группе.

В части группировки я использую df%>% group_by (идентификаторы), но у меня возникают проблемы сгенерация всех возможных пар последовательности.

Какая функция будет полезна для генерации этих комбинаций, предпочтительно без необходимости вручную вводить последовательности, потому что у меня более 1000?Конечная цель генерации этих пар состоит в том, чтобы иметь возможность проверить сходство между каждой из последовательностей.

Khaynes · Answer 1 · 29 июня 2019

Вы можете просто использовать расширенную сетку для того же столбца (вектора)?

x <- c(1,2,3,4,5,6)
expand.grid(x, x)

Если вы не хотите возвращать идентичные идентификаторы и повторение:

t(combn(x, 2))

Как создать все возможные пары внутри столбца в наборе данных в R?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как создать все возможные пары внутри столбца в наборе данных в R?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов