У меня есть следующие df
,
year_month pct
201903 50
201903 40
201903 5
201903 5
201904 90
201904 5
201904 5
Я хочу создать логический столбец с именем non-tail
, который удовлетворяет следующему условию
df.sort_values(['pct'], ascending=False).groupby('year_month')['pct'].apply(lambda x: x.cumsum().le(80))
, что в non-tail
, любое следующее значение в pct
, которое будет добавлено, что делает cumsum сразу большим, чем 80, также будет помечено как True
, поэтому результат будет выглядеть как
year_month pct non-tail
201903 50 True
201903 40 True
201903 5 False
201903 5 False
201904 90 True
201904 5 False
201904 5 False