Построение гистограммы из двух серий в python в одном выражении - PullRequest
0 голосов
/ 24 марта 2020

Я пытаюсь создать гистограмму из двух рядов из необработанных данных. Мои данные выглядят так:

enter image description here

Итак, я хочу сгруппировать по prev_purchase_count, подсчитать уникальных клиентов и разделить / по цветам по сегментам.

Я написал несколько строк кода, которые достигают того, что я хочу сделать, но Я знаю, что есть более простой способ - возможно, одна строка.

lv_purch = df_customers.loc[df_customers['segment']=='low-value','prev_purchase_count']
hv_purch = df_customers.loc[df_customers['segment']=='high-value','prev_purchase_count']
plt.hist([lv_purch,hv_purch], label=['low-value','high-value'])
plt.legend(loc='upper right')
plt.show()

Desired Output

Большое спасибо!

Ответы [ 2 ]

0 голосов
/ 26 марта 2020

Нашли!

import seaborn as sns
ax = sns.countplot(x='prev_purchase_count', hue = 'segment', data=df_customers)
plt.legend(loc='upper right'
0 голосов
/ 24 марта 2020

Вы можете использовать df.groupby (['prev_purchase_count']), чтобы сгруппировать их по минимуму или максимуму

...