Dataframes python удаляет дубликаты - PullRequest
0 голосов
/ 11 декабря 2018

У меня есть фрейм данных, который выглядит следующим образом

  TaskID Status         Time         
0    123   Progress     12.00
1    234   Progress     12.10
2    123   Almost Done  12.20
3    234   Completed    12.40

Мне нужно обновить статус записей самыми последними записями без изменения значений других столбцов и удалить последние дубликаты записей.

Окончательный результат

   TaskID Status         Time         
0    123   Almost Done  12.00
1    234   Completed    12.10

Как этого добиться?Спасибо.

1 Ответ

0 голосов
/ 11 декабря 2018

Я полагаю, вам нужно агрегировать по agg с first и last:

df = df.groupby('TaskID', as_index=False).agg({'Status':'last','Time':'first'})
print (df)
   TaskID       Status  Time
0     123  Almost Done  12.0
1     234    Completed  12.1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...