Чтобы объединить CSV-файл с данными за день в месяц - PullRequest
0 голосов
/ 12 ноября 2018

У меня есть CSV-файл с именем crime.csv, как показано ниже: -

OFFENSE_CODE    OFFENSE_TYPE        OFFENSE_DESCRIPTION             DISTRICT    DAY YEAR    MONTH   STREET          NO_OF_CRIME
1106            Confidence Games    FRAUD - CREDIT CARD / ATM FRAUD     B2      1   2018    2       WASHINGTON ST   1
3201            Property Lost       PROPERTY - LOST                     B2      15  2018    3       ELM HILL AVE    1
1001            Counterfeiting      FORGERY / COUNTERFEITING            D4      9   2018    1       TREMONT ST      1
2629            Harassment          HARASSMENT                          E5      1   2018    1       CROWN POINT DR  1
1001            Counterfeiting      FORGERY / COUNTERFEITING            E5      8   2018    4       REDGATE RD      1
1106            Confidence Games    FRAUD - CREDIT CARD / ATM FRAUD     D4      22  2018    2       BOYLSTON ST     1
2629            Harassment          HARASSMENT                          B2      9   2017    10      AKRON ST        1
1102            Fraud               FRAUD - FALSE PRETENSE / SCHEME     A7      25  2018    4       LIVERPOOL ST    1
3201            Property Lost       PROPERTY - LOST                     D14     1   2018    1       FIDELIS WAY     1
1106            Confidence Games    FRAUD - CREDIT CARD / ATM FRAUD     E5      12  2018    4       SPRING ST       1
3201            Property Lost       PROPERTY - LOST                     A1      30  2018    4       NASHUA ST       1

Мне нужно объединить эти данные в месячные данные на основе OFFENCE_CODE.Так что NO_OF_CRIMES агрегируется за этот конкретный месяц.Любая помощь будет очень полезна.

Ответы [ 2 ]

0 голосов
/ 12 ноября 2018

Мы можем использовать tidyverse

library(tidyverse)
df1 %>%
   group_by(OFFENCE_CODE, YEAR, MONTH) %>%
   mutate(SUM_NO_OF_CRIME = sum(NO_OF_CRIME))
0 голосов
/ 12 ноября 2018

Предполагая, x является именем кадра данных:

aggregate(x$NO_OF_CRIME, by = list(x$OFFENCE_CODE, x$MONTH), FUN = sum)
...