У меня есть CSV-файл hello.csv
со временем загрузки и я хочу считать количество загрузок за квартал. Приведенный ниже код работает хорошо, но я становлюсь кварталом и считаю этот квартал для каждой строки файла CSV. Я хочу подвести итог, что подсчет за квартал приходит только один раз. Или другими словами я хочу удалить дубликаты
df = pd.read_csv('hello.csv')
df['quarter'] = pd.PeriodIndex(df.time, freq='Q')
df['count'] = df.groupby('quarter')['quarter'].transform('count')
df = df[['quarter','count']]
12.130.14.jga 2016-08-06 23:14:47 34903 0001193125-16-644579
26955 12.130.14.jga 2016-08-16 01:39:04 1555218 0001193125-12-475878
26956 12.130.14.jga 2016-08-16 01:42:51 1605607 0001193125-14-323048
26957 12.130.14.jga 2016-08-18 22:56:56 1001039 0001001039-16-000468
26958 12.130.14.jga 2016-08-19 01:29:37 1447599 0001193125-15-376713
26959 12.130.14.jga 2016-08-22 13:09:57 1651308 0001047469-16-009959
26960 12.130.14.jga 2016-08-25 15:45:39 1271024 0001193125-11-314369
26965 12.130.14.jga 2016-09-01 19:14:42 1447669 0001157523-16-006477
26966 12.130.14.jga 2016-09-26 14:06:24 712034 0001193125-12-000769
26967 12.130.14.jga 2016-09-26 14:07:01 712034 0001193125-12-056675
26968 12.130.14.jga 2016-09-26 14:07:59 712034 0001193125-12-054758
Это выдержка из моего CSV-файла, все даты которого датируются 2016Q3, поэтому я хочу получить вывод «[2016Q3 11]». Но я становлюсь фреймом данных с 11 одинаковыми строками