Я хочу отбросить повторяющиеся значения для col1
, сохраняя только строки с самым высоким значением в col2
.Пример df:
df1 = pd.DataFrame({'col1': ['a', 'a', 'b', 'b', 'c'],
'col2': [5, 5, 10, 15, 20]})
Я знаю, df1.drop_duplicates
избавится от повторяющихся значений, но как мне убедиться, что это наибольшее значение, которое сохраняется (или несколько значений, если есть значения, привязанные к наибольшему)??
Желаемый вывод:
dfoutput = pd.DataFrame({'col1': ['a', 'a', 'b', 'c'],
'col2': [5, 5, 15, 20]})