У меня есть большой массив данных pandas с идентификаторами и датами встречи:
ID Encounter_date
A 2019-01-01 17:00
B 2019-01-01 17:00
A 2018-06-01 17:00
A 2017-01-01 17:00
Я хотел бы захватить встречи по идентификатору в течение 1 года pd.Timedelta (days = 365) до указанной даты встречи, так что я получаю вывод df, такой как:
ID Encounter_date within_1_year
A 2019-01-01 17:00 3
B 2019-01-01 17:00 1
A 2018-06-01 17:00 2
A 2018-01-02 17:00 2
A 2017-05-01 17:00 1
Например, для первой строки между 2018-01-01 и 2019-01-01 существует три встречи, а именно: строка 1, строка 3, строка 4. Строка 2 - это другой идентификатор, а строка 5 - нет. в течение года.
Я обнаружил, что выполняю вычисления по идентификатору, перебирая уникальные идентификаторы и находя связанные строки медленными, и не могу понять, как это сделать с помощью groupby.
Спасибо за ваше внимание.