Фильтрация времени начала одной строки и времени окончания другой строки с использованием Python - PullRequest
0 голосов
/ 21 февраля 2019

У меня есть набор данных с повторными действиями.Мне нужно отфильтровать их таким образом, чтобы у меня была дата начала первого и последнего дня последнего вхождения вместе с одним действием.

Фрейм данных:

https://i.stack.imgur.com/UC0SP.png

Просьба ссылаться на предоставленную ссылку.Любая помощь будет оценена.

Спасибо

Ответы [ 2 ]

0 голосов
/ 22 февраля 2019

Полагаю, вы пытаетесь выяснить, что происходит в «мероприятиях» относительно времени начала и окончания.Например, если вы пробуете клуб «а», то время начала первого «а» и время окончания последнего «а» - это то, что вы пытаетесь получить.

0 голосов
/ 21 февраля 2019

Сначала преобразуйте столбцы в дату-время, если необходимо:

df[['Start','End']] = df[['Start','End']].apply(pd.to_datetime)

А затем агрегируйте first или last или min и maxпо группам:

df1 = df.groupby('Activity', as_index=False).agg({'Start':'first', 'End':'last'})

df1 = df.groupby('Activity', as_index=False).agg({'Start':'min', 'End':'max'})
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...