Как выбрать случайную дату и время двух разных столбцов? - PullRequest
0 голосов
/ 10 ноября 2018

После объединения данных я получил dataframe как:

Name      Stage           Start                 End

Hulk        A1     21/10/2018 06:34:15    21/10/2018 07:34:15
Hulk        A4     21/10/2018 07:34:15    21/10/2018 08:34:15
Sam         A1     21/10/2018 09:34:15    21/10/2018 10:34:15
Sam         A4     21/10/2018 10:34:15    21/10/2018 11:34:15

, поэтому мне нужно расположить эти данные следующим образом: start из A1 и end из A4:

Name      Stage           Start                 End

Hulk        A1,A4     21/10/2018 06:34:15    21/10/2018 08:34:15
Sam         A1,A4     21/10/2018 09:34:15    21/10/2018 11:34:15

Как это можно достичь? Я совсем новичок с python и pandas.

1 Ответ

0 голосов
/ 10 ноября 2018

Используйте agg что работает с first и last хорошо, если для каждой группы 2 значения Stage, упорядоченные как в примере данные:

Также join - это чистая функция Python.

df = df.groupby('Name', as_index=False).agg({'Stage':', '.join,'Start':'first', 'End':'last'})
print (df)
   Name   Stage                Start                  End
0  Hulk  A1, A4  21/10/2018 06:34:15  21/10/2018 08:34:15
1   Sam  A1, A4  21/10/2018 09:34:15  21/10/2018 11:34:15
...