R dplyr - частота распространения группировки по месяцам - PullRequest
0 голосов
/ 04 декабря 2018

Я бы хотел сгруппировать мои df по месяцам и годам.Результат должен быть посчитан, частоты для 0 и 1. Я могу получить общие частоты, но не могу их распределить.Проблема в последней строке кода.Я получаю сообщение об ошибке внизу.

id <- 1:1000
outcome <- rbinom(1000, 1, 0.23)
date <- sample(seq(as.Date('2000/01/01'), as.Date('2002/12/31'), by="day"), 1000)
df <- data.frame(id, date, outcome)

library(dplyr)
library(tidyr)

df_month<- df%>%
    mutate(month = format(date, "%m"), year = format(date, "%Y")) %>%
    group_by(month, year) %>%
    summarise(freq = n())%>%
    spread(outcome, freq)

Ошибка: var должно вычислять одно число или имя столбца, а не целочисленный вектор

1 Ответ

0 голосов
/ 04 декабря 2018

Я думаю, это то, что вам нужно -

df_month <- df %>%
  mutate(month = format(date, "%m"), year = format(date, "%Y")) %>%
  group_by(month, year, outcome = paste0("outcome_", outcome)) %>%
  summarise(freq = n()) %>%
  spread(outcome, freq)

# A tibble: 36 x 4
# Groups:   month, year [36]
   month year  outcome_0 outcome_1
   <chr> <chr>     <int>     <int>
 1 01    2000         18        10
 2 01    2001         22         3
 3 01    2002         22         6
 4 02    2000         20         8
 5 02    2001         21         4
 6 02    2002         22         5
 7 03    2000         20         9
 8 03    2001         24         5
 9 03    2002         26         3
10 04    2000         19         9
# ... with 26 more rows
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...