Я пытаюсь выяснить, как сгруппировать по одной переменной и сохранить все остальные переменные, которые имеют такой же шаблон вариаций. Вот пример df, где gp - моя группирующая переменная:
V1 V2 V3 V4 V5 V6 gp
1 0 1 0 0 0 0 x
2 0 0 0 0 1 0 x
3 1 0 1 0 1 1 y
4 0 0 0 0 0 1 x
Что я хотел бы получить в итоге:
V1 V3 gp
1 0 0 x
2 0 0 x
3 1 1 y
4 0 0 x
Я пробовал несколько вещей, но ничто, что получит меня, близко к чему-то полезному. Мои реальные данные будут намного больше, но я думаю, что это хорошее место для начала. В этом случае я мог бы сделать что-то числительное c, но мои «настоящие данные» - это данные геномного c, и поэтому их сложнее добавить, чем 0 и 1.
data:
structure(list(V1 = c(0L, 0L, 1L, 0L), V2 = c(1L, 0L, 0L, 0L),
V3 = c(0L, 0L, 1L, 0L), V4 = c(0L, 0L, 0L, 0L), V5 = c(0L,
1L, 1L, 0L), V6 = c(0L, 0L, 1L, 1L), gp = structure(c(1L,
1L, 2L, 1L), .Label = c("x", "y"), class = "factor")), class = "data.frame", row.names = c(NA,
-4L))