У меня есть фрейм данных, в основном с категориальными столбцами:
df = pd.DataFrame({
'col_to_group': ['A', 'A', 'B', 'B', 'A'],
'col_1': ['a', 'b', 'c', 'a', 'a'],
'col_2': ['x', 'y', 'y', 'y','x'],
'col_3': [.1, .2, .1, .9, .7]
})
По сути, я хочу построить диаграммы для col_1
, col_2
по подгруппам из col_to_group
(A, B) и для всегодатафрейм (ВСЕ).
Вот мое текущее решение:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame({
'col_to_group': ['A', 'A', 'B', 'B', 'A'],
'col_1': ['a', 'b', 'c', 'a', 'a'],
'col_2': ['x', 'y', 'y', 'y','x'],
'col_3': [.1, .2, .1, .9, .7]
})
for i in ['col_1', 'col_2']:
L = df.groupby('col_to_group')[i].value_counts(normalize=True).unstack().T
R = df[i].value_counts(normalize=True).rename('ALL')
z = pd.concat([L, R], axis=1, sort=True).T
#z.T.to_csv(i+'_bar.csv')
#plotting:
zz = z.plot.bar(stacked=True).legend(bbox_to_anchor=(1.0, 1.0)).get_figure()
plt.title(i, fontsize = 12)
zz.savefig(i+'_bar.png', dpi=300, bbox_inches='tight')
plt.show()
z
создание замысловато, также я не фанат matplotlib
- это можно сделать водна строка?
Я ищу пандастическое решение для этого.