Я пытаюсь groupby
несколько столбцов в DataFrame
и сохранить только те строки, в которых конкретный столбец изменил значения.
Вот пример набора данных
Id Type Size StoredAt
107 1 20 2019-08-01
107 1 20 2019-08-02
107 1 20 2019-07-31
107 1 20 2019-07-30
107 3 20 2019-07-29
108 1 20 2019-08-01
108 1 20 2019-08-02
108 3 20 2019-07-31
То, что я пытаюсь сделать, это groupby
, поэтому у меня есть только две строки, которые показывают, когда тип изменился с 1 на три. Вот как я хочу, чтобы DataFrame
выглядело так.
Id Type Size StoredAt
107 1 20 2019-08-01
107 3 20 2019-07-29
108 1 20 2019-08-01
108 3 20 2019-07-31
Все, что у меня есть до сих пор
dataFrame.groupby(['Id', 'Type', 'Size'])['Id', 'Type', 'Size', 'StoredAt']
Что не возвращает того, что я ожидаю.