У меня есть следующий фрейм данных:
d = {'group': ['a', 'b', 'c', 'b', 'b', 'c', 'a', 'b', 'a'],
'cum_sum': [1, 4, 3, 9, 15, 6, 3, 17, 4]}
df = pd.DataFrame(data=d)
Я хочу отфильтровать весь фрейм данных, чтобы хранить только записи в каждой группе, у которых cum_sum меньше максимального cum_sum x 0,8 в каждой группе.
Я пытался поиграться с параметрами лямбды и отфильтровать это:
grouped = df.groupby('group')
grouped.filter(lambda x: x[x.cum_sum] <= x[x.cum_sum.max()])
Но я просто понятия не имею, с чего начать ... Любые идеи ..?
ОБНОВЛЕНО В СООТВЕТСТВИИ С КОММЕНТАРИИ!