Изменение диапазона Quartile - PullRequest
       14

Изменение диапазона Quartile

0 голосов
/ 15 октября 2018

у меня есть некоторые данные

a = pd.DataFrame([1,22,34,55,66,75,2,7,8,9,99,70,45,56,22,12,5,9,3,5,89,67,42,21])

, когда я использую функцию описания, я получаю следующие результаты:

a.describe()
Out[6]: 
               0
count  24.000000
mean   34.333333
std    30.786314
min     1.000000
25%     7.750000
50%    22.000000
75%    58.500000
max    99.000000

я получаю результаты, показывающие данные в диапазоне от 0 до 25%, 25% до 50% и от 50% до 75%.Я хочу получить результаты, которые показывают результаты в 10%, 20% 30% ... и так далее.Пожалуйста, дайте мне знать, как получить эти результаты.

1 Ответ

0 голосов
/ 15 октября 2018

Вы можете использовать Numpy quantile, задав параметр q с требуемыми процентами, такими как:

np.quantile(a,q=np.linspace(0.1,1,num=10))
array([ 3.6,  6.2,  8.9, 13.8, 22. , 40.4, 55.1, 66.4, 73.5, 99. ])

Диапазон квантилей составляет от 10% до 100%:

np.linspace(0.1,1,num=10)
array([0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. ])

Или используя Numpy percentile:

np.percentile(a,q=np.linspace(10,100,num=10))
array([ 3.6,  6.2,  8.9, 13.8, 22. , 40.4, 55.1, 66.4, 73.5, 99. ])

Диапазон процентилей составляет от 10% до 100%:

np.linspace(10,100,num=10)
array([ 10.,  20.,  30.,  40.,  50.,  60.,  70.,  80.,  90., 100.])
...