Способ преобразования данных в децили на основе суммы другого столбца - PullRequest
0 голосов
/ 21 мая 2019

Используя панд, я пытаюсь связать информационный кадр в децили, используя ранжированный счет (x), так что каждый дециль содержит равные значения, основанные на сумме другого столбца (y).

Другими словами, он будет заполнять каждый дециль, пока не достигнет определенного значения (сумма y // 10), а затем перейдет к следующему децилю.

Я пытался использовать cut и qcut, но он разделяется только по x, а не по значениям в y.

1 Ответ

2 голосов
/ 21 мая 2019

Вы можете сделать с cumsum + groupby

d={x: y for x , y df.groupby(df.y.cumsum()//10)}
d[0]
...