У меня есть датафрейм, похожий на:
In [3]df
Out[3]:
customer monthly_revenue
0 a 2
1 a 4
2 a 1
3 b 3
4 b 3
5 b 3
6 b 2
7 b 5
8 c 10
9 c 5
Для каждого клиента я хочу просмотреть их ежемесячные данные о доходах и подсчитать, сколько точек данных превышает или ниже определенного порогового значения. Каков наилучший способ сделать итерацию здесь?
Результат, который я хочу:
customer rev_over_2 rev_over_5
0 a 0.33 0.0
1 b 0.80 0.2
2 c 1.00 1.0
Второй столбец означает процент точек данных, превышающих 2, а третий столбец означает процент точек данных, превышающих 5.
Спасибо!