Создание бункеров на процентилях, а затем сводная таблица на бункерах - PullRequest
0 голосов
/ 23 января 2020

У меня есть датафрейм, как показано ниже.

dataframe1 = 
Ind  AA        BB      Category
0    10.0      100     0
1    11.5      140     1
2    9.0       200     1
3    4.0       120     1
4    5.6       123     0
5    10.0      120     1
6    17.0      156     0
7    21.0      76      1
8    10.0      67      1
9    3.0       100     0
10   29.0      120     0
11   10.0      45      0
12   23.0      100     1

Теперь, выполнив dataframe1.min (), dataframe1.max (), dataframe1.quantile (0.2), q0.4, q0.6, q0 .8, я получил минимальный, максимальный и 4 квантилей для столбцов AA и BB. Теперь я хочу получить фрейм данных, который дает мне столбцы для столбцов AA и BB в зависимости от процентилей. поэтому для столбцов AA и BB будет 5 бинов.

Скажем, для AA 10 в бине 3, поэтому 10 будет заменено на 3 в новом кадре данных. Скажем, для BB 100 в бине 4, поэтому 100 будет заменено на 4 в новом кадре данных. И категория остается неизменной. Так что, наконец, я могу сделать сводную таблицу, чтобы получить счетчик категорий 0 и 1 в каждом бине для столбцов AA и BB.

Надеюсь, вы понимаете, о чем я. может выглядеть как ..

             bin
AA           1    2    3    4   5 
Category  0  1    0    0    1   0
          1  0    1    1    0   0


             bin
BB           1    2    3    4   5 
Category  0  0    0    1    0   1
          1  1    0    0    1   0

Нужна помощь.

...