Для этого вы можете использовать необязательные аргументы для функциональности drop_duplicates
.
В качестве игрушечного примера рассмотрим кадры:
df1 = pd.DataFrame({"id" : [1,2,3,4], "time" : [25, 35, 45, 15]})
df2 = pd.DataFrame({"id" : [4,5,2,9], "time" : [19, 14, 11, 12]})
Затем все, что вам нужно сделать, это объединить df1
и df2
, отбросить дубликаты на id
и сохранитьlast
, чтобы убедиться, что информация хранится в df2
.
df_concatenated = pd.concat([df1, df2]).drop_duplicates(subset="id", keep="last")
df_concatenated
> id time
1 25
3 45
4 19
5 14
2 11
9 12