Я пытаюсь создать таблицу, которая включает относительные частоты (counts
) переменных, взятых из двух групп (A
и B
), которые попадают в предварительно заданную временную intervals
. Моя проблема в том, что если строка начинается с 0 секунд (см. start_sec
), переменная не попадает в интервал 0-5 секунд interval
, а помечается как NA
(см. Вывод). Я хочу включить эти случаи в вышеупомянутый интервал.
Это фиктивный пример:
Переменные
group <- c("A","A","A","A","A","A","B","B","B")
person <- c("p1","p1","p1","p3","p2","p2","p1","p1","p2")
start_sec <- c(0,10.7,11.8,3.9,7.4,12.1,0,3.3,0)
dur_sec <- c(7.1,8.2,9.3,10.4,11.5,12.6,13.7,14.8,15.9)
Фрейм данных
df <- data.frame(group,person,start_sec,dur_sec)
df

Pipeline
df %>%
group_by(group,person, interval=cut(start_sec, breaks=c(0,5,10,15))) %>%
summarise(counts= n(),sum_dur_sec=sum(dur_sec))
Выход (пока)

Заранее благодарим за все комментарии и отзывы!