Сейчас у меня есть несколько фреймов данных со следующим макетом:
ID Date Status
123 03/01/2017 1
124 03/01/2017 1
123 03/01/2016 1
123 03/01/2015 0
124 03/01/2014 0
Я хочу объединить все фреймы данных в один фрейм данных, но сохранить только 1 запись уникального идентификатора со следующими условиями:
если дублированные записи идентификаторов имеют статус 1 и 0, отбросить все 0, если дублированные записи идентификаторов имеют несколько статусов 1, я хочу сохранить запись с самой ранней датой
Я в основном хочу сделать то, что этот код будет contribli sh: dataframe = dataframe.groupby ("ID"). agg ({"status": "max", "date": "min"})
Но это не работает с учетом столбца даты это данные объекта, и я понятия не имею, как это сделать по-другому
Я очень плохо знаком с Python любые советы / рекомендации очень ценятся.