Мои данные выглядят так:
counts <- data.frame(
pos = c(101, 101, 101, 102, 102, 102, 103, 103, 103, 101, 101, 101),
chr = c(1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4),
subj = c("A", "B", "C", "A", "B", "C", "A", "B", "C", "A", "B", "C")
)
pos
должен принадлежать только одному уникальному chr
, но здесь поз 101 относится к chr 1 и 4.
Я могу обнаружить этот случай как:
counts %>% select(pos, chr) %>%
group_by(pos) %>%
summarise(n_chrs = length(unique(chr))) %>%
filter(n_chrs > 1)
Это возвращает pos
, который имеет более чем chr
значения:
A tibble: 1 x 2
pos n_chrs
<dbl> <int>
1 101 2
Что я хотел бы знать, какие chr
значения подразумеваются, что-то вроде:
pos chr
1 101 1
2 101 4
Спасибо!