Считать с условием - PullRequest
       25

Считать с условием

0 голосов
/ 26 мая 2020

Я хотел бы посчитать, как часто встречается одна переменная id_tasks в месяц. Переменная месяца от 1 до 12.

До сих пор мне удавалось только подсчитать, как часто каждая задача выполняется с помощью: Я хотел бы знать, как часто задача возникает в каждом месяце в качестве вывода , чтобы определить, в каком месяце больше / меньше задач.

count(df,c('id_task'))
id_task id_user day completion_yesno day_created has_deadline deadline created_before active overdue completed_before month 
16416   37033    5272  61                0          61            1      172              0      0       0                0
16417   37033    5272  62                0          61            1      172              2      2       0                0
16418   37033    5272  63                0          61            1      172              2      2       0                0
16419   37033    5272  64                0          61            1      172              2      2       0                0
16420   37033    5272  65                0          61            1      172              2      2       0                0
16421   37033    5272  66                0          61            1      172              2      2       0                0
16422   37033    5272  67                0          61            1      172              2      2       0                0
16423   37033    5272  68                0          61            1      172              2      2       0                0
16424   37033    5272  69                0          61            1      172              2      2       0                0
16425   37033    5272  70                0          61            1      172              2      2       0                0
16426   37033    5272  71                0          61            1      172              2      2       0                0
16427   37033    5272  72                0          61            1      172              2      2       0                0
16428   37033    5272  73                0          61            1      172              2      2       0                0
16429   37033    5272  74                0          61            1      172              2      2       0                0
16430   37033    5272  75                0          61            1      172              2      2       0                0
16431   37033    5272  76                0          61            1      172              2      2       0                0
16432   37033    5272  77                0          61            1      172              2      2       0                0
16433   37033    5272  78                0          61            1      172              2      2       0                0
16434   37033    5272  79                0          61            1      172              2      2       0                0
16435   37033    5272  80                0          61            1      172              2      2       0                0

желаемый результат:

id_task  month freq
1         12    3
2          1    20

Ответы [ 2 ]

3 голосов
/ 26 мая 2020

, если вы хотите подсчитать совпадения всех комбинаций задач месяца X, table - ваша функция:

table(df[, c("month", "id_task")])

Вы можете повторно запустить это с этими фиктивными данными:

df <- data.frame(id_task= sample.int(15, 100, replace = TRUE), month = rep(1:12, length.out=100))
table(df[, c("month", "id_task")])

Если вам нужна сумма задач в месяц, просто опустите столбец задач и запустите его следующим образом:

table(df[, c("month")])
2 голосов
/ 26 мая 2020

С пакетом dplyr вы можете задать следующее:

data %>%
> group_by(month) %>%
> count(id_task)

Думаю, это подойдет. (:

...