У меня есть следующее df
, из которого я хочу создать гистограмму:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
df = pd.DataFrame({
'Country': ["A", "B", "C", "D", "E", "F", "G"],
'Answer declined': [0.000000, 0.000000, 0.000000, 0.000667, 0.000833, 0.000833, 0.000000],
"Don't know": [0.003333, 0.000000, 0.000000, 0.001333, 0.001667, 0.000000, 0.000000],
"No": [0.769167, 0.843333, 0.762000, 0.666000, 0.721667, 0.721667, 0.775833],
"Yes": [0.227500, 0.156667, 0.238000, 0.332000, 0.275833, 0.277500, 0.224167]}, )
df.set_index("Country", inplace = True)
Поскольку у меня есть несколько таких df
с, я создал функцию для вызова гистограмм из разныхdf
s:
def bar_plot(plot_df):
N = len(plot_df) # number of groups
num_y_cats = len(plot_df.columns) # number of y-categories (responses)
ind = np.arange(N) # x locations for the groups
width = 0.35 # width of bars
p_s = []
p_s.append(plt.bar(ind, plot_df.iloc[:,0], width))
for i in range(1,len(plot_df.columns)):
p_s.append(plt.bar(ind, plot_df.iloc[:,i], width,
bottom=np.sum(plot_df.iloc[:,:i], axis=1),
label = 'TEST'))
plt.ylabel('[%]')
plt.title('Responses by country')
x_ticks_names = tuple([item for item in plot_df.index])
plt.xticks(ind, x_ticks_names)
plt.yticks(np.arange(0, 1.1, 0.1)) # ticks from, to, steps
plt.legend(p_s, plot_df.columns,
bbox_to_anchor = (0.5, -0.25),
#bbox_to_anchor = (0., 1.02, 1., .102),
loc = 'lower center',
ncol = num_y_cats // 2,
borderaxespad = 0
)
plt.show()
plt.close() # close the figure
bar_plot(df)
Это работает, но я не могу исправить одну проблему с получающимися графиками: если ответы (то есть имена столбцов) содержат «Да», я хочу, чтобы это было показано первым (т.е. внизу) - и ничего не измените в полученном графике в противном случае.
Мои попытки, основанные на этот вопрос, были безуспешными.
РЕДАКТИРОВАТЬ: Я нашел решение и сейчас ищу элегантное решение.