Как суммировать записи во фрейме данных? - PullRequest
0 голосов
/ 22 мая 2019

У меня есть CSV-файл hello.csv со временем загрузки и я хочу считать количество загрузок за квартал. Приведенный ниже код работает хорошо, но я становлюсь кварталом и считаю этот квартал для каждой строки файла CSV. Я хочу подвести итог, что подсчет за квартал приходит только один раз. Или другими словами я хочу удалить дубликаты

df = pd.read_csv('hello.csv')
df['quarter'] = pd.PeriodIndex(df.time, freq='Q')
df['count'] = df.groupby('quarter')['quarter'].transform('count')
df = df[['quarter','count']]
       12.130.14.jga  2016-08-06 23:14:47    34903  0001193125-16-644579   
26955  12.130.14.jga  2016-08-16 01:39:04  1555218  0001193125-12-475878   
26956  12.130.14.jga  2016-08-16 01:42:51  1605607  0001193125-14-323048   
26957  12.130.14.jga  2016-08-18 22:56:56  1001039  0001001039-16-000468   
26958  12.130.14.jga  2016-08-19 01:29:37  1447599  0001193125-15-376713   
26959  12.130.14.jga  2016-08-22 13:09:57  1651308  0001047469-16-009959   
26960  12.130.14.jga  2016-08-25 15:45:39  1271024  0001193125-11-314369   
26965  12.130.14.jga  2016-09-01 19:14:42  1447669  0001157523-16-006477   
26966  12.130.14.jga  2016-09-26 14:06:24   712034  0001193125-12-000769   
26967  12.130.14.jga  2016-09-26 14:07:01   712034  0001193125-12-056675   
26968  12.130.14.jga  2016-09-26 14:07:59   712034  0001193125-12-054758  

Это выдержка из моего CSV-файла, все даты которого датируются 2016Q3, поэтому я хочу получить вывод «[2016Q3 11]». Но я становлюсь фреймом данных с 11 одинаковыми строками

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...