Невозможно правильно сгруппировать и суммировать - PullRequest
0 голосов
/ 29 мая 2020

У меня есть данные, похожие на эти Образцы данных :

   Cities Country    Date Cases
1      BE       A 2/12/20    12
2      BD       A 2/12/20   244
3      BF       A 2/12/20     1
4               V 2/12/20    13
5               Q 2/13/20     2
6               D 2/14/20     4
7      GH       N 2/15/20     6
8      DA       N 2/15/20   624
9      AG       J 2/15/20   204
10     FS       U 2/16/20   433
11     FR       U 2/16/20    38

Я хочу организовать данные по дате и стране, а затем суммировать ежедневный случай страны. Однако я пробую что-то вроде, это показывает общую сумму:

my_data %>%
  group_by(Country, Date)%>%
  summarize(Cases=sum(Cases))

Ответы [ 2 ]

1 голос
/ 29 мая 2020

Ваша summarize функция, вероятно, вызывается из другого пакета (plyr?). Попробуйте позвонить по номеру dplyr::sumarize так:

my_data %>%
  group_by(Country, Date)%>%
  dplyr::summarize(Cases=sum(Cases))
# A tibble: 7 x 3
# Groups:   Country [7]
  Country Date    Cases
  <fct>   <fct>   <int>
1 A       2/12/20   257
2 D       2/14/20     4
3 J       2/15/20   204
4 N       2/15/20   630
5 Q       2/13/20     2
6 U       2/16/20   471
7 V       2/12/20    13

Сочувствую, что это может быть очень неприятно. У меня есть привычка всегда использовать dplyr::select, dplyr::filter и dplyr::summarize. В противном случае вы потратите ненужное время, разочаровавшись в том, почему ваш код не работает.

0 голосов
/ 29 мая 2020

Мы также можем использовать aggregate

aggregate(Cases ~ Country + Date, my_data, sum)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...