Как использовать groupby, чтобы найти события в течение одного года после текущего события для всех идентификаторов - PullRequest
1 голос
/ 16 июня 2019

У меня есть большой массив данных pandas с идентификаторами и датами встречи:

ID     Encounter_date
A      2019-01-01 17:00
B      2019-01-01 17:00
A      2018-06-01 17:00
A      2017-01-01 17:00

Я хотел бы захватить встречи по идентификатору в течение 1 года pd.Timedelta (days = 365) до указанной даты встречи, так что я получаю вывод df, такой как:

ID     Encounter_date     within_1_year
A      2019-01-01 17:00   3
B      2019-01-01 17:00   1
A      2018-06-01 17:00   2
A      2018-01-02 17:00   2
A      2017-05-01 17:00   1

Например, для первой строки между 2018-01-01 и 2019-01-01 существует три встречи, а именно: строка 1, строка 3, строка 4. Строка 2 - это другой идентификатор, а строка 5 - нет. в течение года.

Я обнаружил, что выполняю вычисления по идентификатору, перебирая уникальные идентификаторы и находя связанные строки медленными, и не могу понять, как это сделать с помощью groupby.

Спасибо за ваше внимание.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...