Переменные NA в сводке dplyr - PullRequest
       15

Переменные NA в сводке dplyr

0 голосов
/ 14 сентября 2018

Я пытаюсь создать таблицу, которая включает относительные частоты (counts) переменных, взятых из двух групп (A и B), которые попадают в предварительно заданную временную intervals. Моя проблема в том, что если строка начинается с 0 секунд (см. start_sec), переменная не попадает в интервал 0-5 секунд interval, а помечается как NA (см. Вывод). Я хочу включить эти случаи в вышеупомянутый интервал.

Это фиктивный пример:

Переменные

group <-   c("A","A","A","A","A","A","B","B","B")
person <-  c("p1","p1","p1","p3","p2","p2","p1","p1","p2")
start_sec <- c(0,10.7,11.8,3.9,7.4,12.1,0,3.3,0)
dur_sec <- c(7.1,8.2,9.3,10.4,11.5,12.6,13.7,14.8,15.9)

Фрейм данных

df <-  data.frame(group,person,start_sec,dur_sec)
df

Data frame

Pipeline

df %>%
group_by(group,person, interval=cut(start_sec, breaks=c(0,5,10,15))) %>%
summarise(counts= n(),sum_dur_sec=sum(dur_sec))

Выход (пока)

Output

Заранее благодарим за все комментарии и отзывы!

...