Как распечатать категории в pandas.cut? - PullRequest
0 голосов
/ 16 сентября 2018

Обратите внимание, что когда вы вводите pandas.cut в фрейм данных, вы получаете ячейки каждого элемента: Name :, Length :, dtype: и Categories в выходных данных. Я просто хочу, чтобы массив Категории был напечатан для меня, чтобы я мог получить только диапазон количества бинов, которые я искал . Например, с бинами = 4, введенными в кадр данных с числами «1,2,3,4,5», я бы хотел, чтобы вывод выводил только диапазон из четырех бинов, то есть (1, 2], (2, 3], (3, 4], (4, 5].

В любом случае, я могу это сделать? Это может быть что угодно, даже если для этого не требуется печатать «Категории».

1 Ответ

0 голосов
/ 09 февраля 2019

Я догадался, что вы просто хотели бы получить 'bins' от pd.cut().Если это так, вы можете просто установить retbins=True, см. документ pd.cut Например:

In [01]:

data = pd.DataFrame({'a': [1, 2, 3, 4, 5]})
cats, bins = pd.cut(data.a, 4, retbins=True)

Out [01]:

cats:

0    (0.996, 2.0]
1    (0.996, 2.0]
2      (2.0, 3.0]
3      (3.0, 4.0]
4      (4.0, 5.0]
Name: a, dtype: category
Categories (4, interval[float64]): [(0.996, 2.0] < (2.0, 3.0] < (3.0, 4.0] < (4.0, 5.0]]

bins:

array([0.996, 2.   , 3.   , 4.   , 5.   ])

Затем вы можете повторно использовать bins по своему усмотрению.например,

lst = [1, 2, 3]
category = pd.cut(lst,bins)
...