У меня есть такой фрейм данных:
Name Start End Feature
A 50 100 N
A 55 97 R
A 160 200 L
B 300 350 Y
B 310 350 X
B 349 370 M
Я хотел бы получить новый фрейм данных, сгруппированный по первому, второму и третьему столбцу, но я хотел бы получить две новые переменные: одна с подсчетом количество раз, когда столбец A повторяется, а другой подсчитывает количество разных координат, представляющих небольшое перекрытие (скажем, я хочу менее 20% перекрытия, вычисляя его как length(overlaped_region)/mean(c(length(region1), length(region2))
.
Как я могу достичь это?
Я пробовал:
newdf<- df %>% group_by(Names, Start, End) %>% summarise (count(Start), ???)
Как я могу получить столбец, в котором подсчитывается количество различных координат, перекрывающихся менее чем на 20% для каждого имени?
Name Count1 Count2
A 3 2
B 3 2