Как группировать, сравнивая два столбца uisng pandas - PullRequest
0 голосов
/ 25 мая 2020

Имеется df с именем столбца и exm_date

name   roll       exm_date 

tom    242    2019-03-05 11:48:03.166              
mark   244    2018-03-05 11:48:03.166                   

tom    244    2020-03-05 11:48:03.166              
mark   242    2019-03-05 11:48:03.166    

Как получить минимальную дату путем сравнения имени и рулона. если ролл отличается, его следует рассматривать как отдельную запись

ожидаемый_вывод

name   roll       exm_date 

tom    242    2019-03-05 11:48:03.166              
mark   244    2018-03-05 11:48:03.166                   
tom    244    2020-03-05 11:48:03.166   

Для сравнения одного столбца (имени) с датой я использовал это:

df=df.groupby('name')['exm_date'].min().reset_index()

пробовал это:

df=df.groupby('name','roll')['exm_date'].min().reset_index()

1 Ответ

2 голосов
/ 25 мая 2020

В предложении groupby отсутствуют квадратные скобки ([]):

Сделайте следующее:

df = df.groupby(['name','roll'])['exm_date'].min().reset_index()
...