(Python) - Как отбросить дубликаты на основе указанных c условий двух других столбцов - PullRequest
0 голосов
/ 26 февраля 2020

Сейчас у меня есть несколько фреймов данных со следующим макетом:

ID        Date       Status
123    03/01/2017     1
124    03/01/2017     1
123    03/01/2016     1
123    03/01/2015     0
124    03/01/2014     0

Я хочу объединить все фреймы данных в один фрейм данных, но сохранить только 1 запись уникального идентификатора со следующими условиями:

если дублированные записи идентификаторов имеют статус 1 и 0, отбросить все 0, если дублированные записи идентификаторов имеют несколько статусов 1, я хочу сохранить запись с самой ранней датой

Я в основном хочу сделать то, что этот код будет contribli sh: dataframe = dataframe.groupby ("ID"). agg ({"status": "max", "date": "min"})

Но это не работает с учетом столбца даты это данные объекта, и я понятия не имею, как это сделать по-другому

Я очень плохо знаком с Python любые советы / рекомендации очень ценятся.

...