составной столбчатый график из цикла без добавления различных компонентов столбцов - PullRequest
0 голосов
/ 03 марта 2019

У меня есть такой набор данных (номер столбца и строки может изменяться, поэтому мне нужно определить функцию для построения графика).

import pandas as pd
import numpy as np
plot_df = pd.DataFrame({
  'decl': [0.000000, 0.000000, 0.000000, 0.000667, 0.000833, 0.000833, 0.000000],
  'dk': [0.003333, 0.000000, 0.000000, 0.001333, 0.001667, 0.000000, 0.000000],
  'yes': [0.769167, 0.843333, 0.762000, 0.666000, 0.721667, 0.721667, 0.775833],
  'no': [0.227500, 0.156667, 0.238000, 0.332000, 0.275833, 0.277500, 0.224167]})

Для этих данных я хотел бы создать графиксродни тому, который создан с помощью этого кода для статического числа:

# configure plot
N = len(plot_df) # number of groups
num_y_cats = len(plot_df.columns) # number of y-categories (responses)
ind = np.arange(N) # x locations for the groups
width = 0.35 # width of bars

p1 = plt.bar(ind, plot_df.iloc[:,0], width)
p2 = plt.bar(ind, plot_df.iloc[:,1], width)
p3 = plt.bar(ind, plot_df.iloc[:,2], width)
p4 = plt.bar(ind, plot_df.iloc[:,3], width)

plt.ylabel('[%]')
plt.title('Responses by country')

x_ticks_names = tuple([item for item in plot_df.index])

plt.xticks(ind, x_ticks_names)
plt.yticks(np.arange(0, 1.1, 0.1)) # ticks from, to, steps
plt.legend((p1[0], p2[0], p3[0], p4[0]), ('decl', 'dk', 'yes', 'no'))
plt.show()

Это дает мне следующий сюжет , который ставит две проблемы, которые я не могу преодолеть, и ищу помощь:

  1. Числа не складываются до 1,0 - хотя они должны, как я создал оригинал df с нормализацией (plot_df['sum'] = plot_df['decl'] + plot_df['dk'] + plot_df['yes'] + plot_df['no']).
  2. Другая проблема заключается вчто я хочу определить функцию, создающую один и тот же график для df s с переменным числом строк и столбцов, но я застрял в части, создающей различные графики.Пока что у меня есть:

    def bar_plot(plot_df):
    ''' input: data frame where rows are groups; columns are plot components to be stacked '''
    
    # configure plot
    N = len(plot_df) # number of groups
    num_y_cats = len(plot_df.columns) # number of y-categories (responses)
    ind = np.arange(N) # x locations for the groups
    width = 0.35 # width of bars
    
    for i in range(num_y_cats): # for every response in the number of responses, e.g. 'Yes', 'No' etc.
        p = plt.bar(ind, plot_df.iloc[:,i], width) # plot containing the response
    
    plt.ylabel('[%]')
    plt.title('Responses by group')
    
    x_ticks_names = tuple([item for item in plot_df.index]) # create a tuple containing all [country] names
    
    plt.xticks(ind, x_ticks_names)
    plt.yticks(np.arange(0, 1.1, 0.1)) # ticks from, to, steps
    plt.show()   
    

Однако проблема в том, что цикл не добавляет должным образом разные слои, и я не могу понять, как это сделать.Может ли кто-нибудь дать мне указатель?

Ответы [ 2 ]

0 голосов
/ 04 марта 2019

Функция, предоставляемая @mortysporty (все кредиты соответственно), может быть настроена для выполнения желаемой задачи, просто добавив несколько строк в начале, на которые ссылаются позже:

import matplotlib.pyplot as plt
import numpy as np

def newest_bar_plot(plot_df):
    N = len(plot_df) # number of groups
    ind = np.arange(N) # x locations for the groups
    width = 0.35 # width of bars

    p_s = []
    p_s.append(plt.bar(ind, plot_df.iloc[:,0], width))
    for i in range(1,len(plot_df.columns)):
        p_s.append(plt.bar(ind, plot_df.iloc[:,i], width,
                           bottom=np.sum(plot_df.iloc[:,:i], axis=1)))

    plt.ylabel('[%]')
    plt.title('Responses by country')

    x_ticks_names = tuple([item for item in plot_df.index])

    plt.xticks(ind, x_ticks_names)
    plt.yticks(np.arange(0, 1.1, 0.1)) # ticks from, to, steps
    plt.legend(p_s, plot_df.columns)
    plt.show()
0 голосов
/ 03 марта 2019

Проблема № 1, если я правильно вас понял, заключается в том, что высота столбцов не равна 1 (т.е. сумма всех фракций).Ваш код

p1 = plt.bar(ind, plot_df.iloc[:,0], width)
p2 = plt.bar(ind, plot_df.iloc[:,1], width)
...

создает четыре столбчатых диаграммы, все начиная с с 0 (по оси Y).Мы хотим, чтобы p2 начинался с p1, p3 начинался с p2 и так далее.Для этого мы можем указать аргумент bottom (по умолчанию 0) в plt.bar.Итак,

p1 = plt.bar(ind, plot_df.iloc[:,0], width)
p2 = plt.bar(ind, plot_df.iloc[:,1], width, bottom=plot_df.iloc[:,0])
...

для p3 мы хотим, чтобы bottom началось с суммы plot_df.iloc[:,0] и plot_df.iloc[:,1].Мы можем сделать это либо явно, либо используя np.sum, например, np.sum(plot_df.iloc[:,:i].Последнее, конечно, имеет то преимущество, что мы можем суммировать по произвольному количеству столбцов (как вы хотите в своей функции).

Что касается вашей функции ... Я дал ей шанс.Вы, вероятно, должны усовершенствовать это самостоятельно

def bar_plot(plot_df):
    width = 0.35 # width of bars

    p_s = []
    p_s.append(plt.bar(ind, plot_df.iloc[:,0], width))
    for i in range(1,len(plot_df.columns)):
        p_s.append(plt.bar(ind, plot_df.iloc[:,i], width,
                           bottom=np.sum(plot_df.iloc[:,:i], axis=1)))

    plt.ylabel('[%]')
    plt.title('Responses by country')

    x_ticks_names = tuple([item for item in plot_df.index])

    plt.xticks(ind, x_ticks_names)
    plt.yticks(np.arange(0, 1.1, 0.1)) # ticks from, to, steps
    plt.legend(p_s, plot_df.columns)
    plt.show()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...