Построение составных баров с общей линией и датами на xlabels - PullRequest
2 голосов
/ 07 мая 2019

Я использую график панд, чтобы сгенерировать гистограмму с накоплением, поведение которой отличается от поведения matplotlib, но даты всегда имеют неправильный формат, и я не могу его изменить. Я также хотел бы, чтобы «общая» линия на графике. Но когда я пытаюсь добавить его, предыдущие полосы стираются. Я хочу сделать диаграмму, подобную приведенной ниже (генерируется Excel). Черная линия - сумма баров.

enter image description here

Я смотрел на некоторые решения в Интернете, но они выглядят хорошо только тогда, когда не так много столбцов, поэтому между метками появляется некоторое пространство.

Вот лучшее, что я мог сделать, а ниже приведен код, который я использовал.

enter image description here

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.ticker as plticker

# DATA (not the full series from the chart)
dates = ['2016-10-31', '2016-11-30', '2016-12-31', '2017-01-31', '2017-02-28', '2017-03-31',
         '2017-04-30', '2017-05-31', '2017-06-30', '2017-07-31', '2017-08-31', '2017-09-30',
         '2017-10-31', '2017-11-30', '2017-12-31', '2018-01-31', '2018-02-28', '2018-03-31',
         '2018-04-30', '2018-05-31', '2018-06-30', '2018-07-31', '2018-08-31', '2018-09-30',
         '2018-10-31', '2018-11-30', '2018-12-31', '2019-01-31', '2019-02-28', '2019-03-31']

variables = {'quantum ex sa': [6.878011, 6.557054, 3.229360, 3.739318, 1.006442, -0.117945,
                               -1.854614, -2.882032, -1.305225, 0.280100, 0.524068, 1.847649,
                               5.315940, 4.746596, 6.650303, 6.809901, 8.135243, 8.127328,
                               9.202209, 8.146417, 6.600906, 6.231881, 5.265775, 3.971435,
                               2.896829, 4.307549, 4.695687, 4.696656, 3.747793, 3.366878],
             'price ex sa': [-11.618681, -9.062433, -6.228452, -2.944336, 0.513788, 4.068517,
                             6.973203, 8.667524, 10.091766, 10.927501, 11.124805, 11.368854,
                             11.582204, 10.818471, 10.132152, 8.638781, 6.984159, 5.161404,
                             3.944813, 3.723371, 3.808564, 4.576303, 5.170760, 5.237303,
                             5.121998, 5.502981, 5.159970, 4.772495, 4.140812, 3.568077]}

df = pd.DataFrame(index=pd.to_datetime(dates), data=variables)

# PLOTTING
ax = df.plot(kind='bar', stacked=True, width=1)
# df['Total'] = df.sum(axis=1)
# df['Total'].plot(ax=ax)
ax.axhline(0, linewidth=1)
ax.yaxis.set_major_formatter(plticker.PercentFormatter())

plt.tight_layout()
plt.show()

Редактировать

Это то, что лучше всего работает для меня. Это работает лучше, чем использование панд df.plot(kind='bar', stacked=True), поскольку позволяет лучше форматировать метки даты по оси x, а также позволяет использовать любое количество рядов для столбцов.

    for count, col in enumerate(df.columns):
        old = df.iloc[:, :count].sum(axis=1)
        bottom_series = ((old >= 0) == (df[col] >= 0)) * old

        ax.bar(df.index, df[col], label=col, bottom=bottom_series, width=31)

    df['Total'] = df.sum(axis=1)
    ax.plot(df.index, df['Total'], color='black', label='Total')

1 Ответ

2 голосов
/ 07 мая 2019

Это то, что вы хотите:

fig, ax = plt.subplots(1,1, figsize=(16,9))
# PLOTTING
ax.bar(df.index, df['price ex sa'], bottom=df['quantum ex sa'],width=31, label='price ex sa')
ax.bar(df.index, df['quantum ex sa'], width=31, label='quantum ex sa')

total = df.sum(axis=1)
ax.plot(total.index, total, color='r', linewidth=3, label='total')

ax.legend()
plt.show()

enter image description here

Редактировать: Кажется, есть ошибка (особенности) при построении графика с датой и временем.Я попытался преобразовать индекс в строку, и это работает:

df.index=df.index.strftime('%Y-%m')

ax = df.plot(kind='bar', stacked=True, width=1)
df['Total'] = df.sum(axis=1)
df['Total'].plot(ax=ax, label='total')
ax.legend()

enter image description here


Редактировать 2: Я думаю, что я знаю, что происходит.Проблема в том, что

ax = df.plot(kind='bar', stacked=True)

возвращает / устанавливает ось x от ax до range(len(df)), помеченную соответствующими значениями от df.index, но не df.index.Поэтому, если мы нанесем вторую серию на один и тот же ax, он не будет отображаться (из-за разного масштаба xaxis).Итак, я попытался:

# PLOTTING
colums = df.columns

ax = df.plot(kind='bar', stacked=True, width=1, figsize=(10, 6))
ax.plot(range(len(df)), df.sum(1), label='Total')
ax.legend()
plt.show()

и все работает как положено

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...