Я пытаюсь посчитать частоту 2 событий в месяц, используя 2 столбца из моего df
. То, что я сделал до сих пор, подсчитало все события по уникальному времени, которое недостаточно эффективно, так как результатов слишком много. Я хочу создать график с результатами после этого.
Я пытался адаптировать свой код с помощью ответов на вопросы SO:
, но, кажется, не получается заставить команду работать, когда я ввожу freq='day'
в команде groupby
.
Мой код:
print(df.groupby(['Priority', 'Create Time']).Priority.count())
который первоначально выдает что-то вроде 170000, приводит к следующей структуре:
Priority Create Time
1.0 2011-01-01 00:00:00 1
2011-01-01 00:01:11 1
2011-01-01 00:02:10 1
...
2.0 2011-01-01 00:01:25 1
2011-01-01 00:01:35 1
...
Но теперь по какой-то причине (я использую Jupyter Notebook) он производит только:
Priority Create Time
1.0 2011-01-01 00:00:00 1
2011-01-01 00:01:11 1
2011-01-01 00:02:10 1
2.0 2011-01-01 00:01:25 1
2011-01-01 00:01:35 1
Name: Priority, dtype: int64
Не знаю, почему результат изменился только на 5 результатов (может быть, я неосознанно что-то изменил).
Я бы хотел, чтобы результаты были в следующем формате:
Priority month Count
1.0 2011-01 a
2011-02 b
2011-03 c
...
2.0 2011-01 x
2011-02 y
2011-03 z
...
Верхние баллы за показкак правильно изменить частоту для других значений, напримерhour/day/month/year
. С ответами, пожалуйста, не могли бы вы объяснить, что происходит в вашем коде, так как я новичок и изучаю панд и хочу понять процесс. Спасибо.