Панды грубая категориальная переменная - PullRequest
0 голосов
/ 25 ноября 2018

Допустим, у меня есть категориальная переменная со следующими значениями, полученными путем вызова unique() для столбца в кадре данных:

Categories (7, object): [0-2, 6-8, 9-11, 3-5, 15-17, 12-14, 24-26]

и что у меня есть следующие вхождениядля каждой из этих категорий, заданных вызовом value_counts():

0-2 209 3-5 34 6-8 17 9-11 7 15-17 6 12-14 3 24-26 1

, что было бы хорошим способом укрупнить / сжать эти категории в две новые категории: «высокая» и «низкая»

1 Ответ

0 голосов
/ 25 ноября 2018

Это использует pd.cut с правильным значением диапазона, и разрезать их на две части, также вы можете использовать qcut, чтобы получить другой результат резки

groupkey=pd.cut(s.index.str.split('-').str[-1].astype(int),2,labels=['low','high'])
s.groupby(groupkey).sum()
low     270
high      7
Name: v, dtype: int64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...