Нарисуйте несколько гистограмм для нескольких подкатегорий в Python - PullRequest
0 голосов
/ 01 октября 2019

У меня есть такой набор данных,

col1   col2
A        5
A        7
A        1
A        6
B        2
B        9
B        8
...
Z        4

Я попытался нарисовать несколько гистограмм, чтобы взглянуть на распределение для каждой подкатегории в col1.

В дополнение, как я могу это сделать, если я хочу выбрать только 10 самых частых подкатегорий в python? Например, я могу использовать value_counts() для расчета суммы для каждой подкатегории.

1 Ответ

1 голос
/ 01 октября 2019

Вы можете использовать GroupBy.size, отсортировать значения и выбрать первое n. И используйте индекс для построения гистограммы, содержащей только упомянутые группы:

ix = df.groupby('col1').size().sort_values(ascending=False).head(2).index
df[df.col1.isin(ix)].groupby('col1').hist()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...