Помещение нескольких графиков matplotlib в Excel с использованием Python 3 - PullRequest
0 голосов
/ 05 июня 2018

Я пытаюсь создать несколько графиков, основанных на кадре данных, который у меня есть в Python 3, перезвонил и экспортировать их в Excel.Я использовал некоторый код из ответа ниже, но когда я использую его для более чем одного графика, он дает мне странные результаты:

Могу ли я программно вставлять графики matplotlib в Excel?

Мой код:

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import openpyxl

filepath = 'C:\Filepath\Template.xlsx'
writer = pd.ExcelWriter(filepath, engine='xlsxwriter')
back.to_excel(writer, sheet_name='test')
writer.save()

## PLOTS
## ts1 is company 1 and ts2 is company 2
def plot_results(df, ts1, ts2, filepath, cell):
    months = mdates.MonthLocator()  # every month
    fig, ax = plt.subplots()
    ax.plot(df['price_date'], df[ts1], label=ts1)
    ax.plot(df['price_date'], df[ts2], label=ts2)
    ax.xaxis.set_major_locator(months)
    ax.xaxis.set_major_formatter(mdates.DateFormatter('%b %Y'))
#    ax.set_xlim(datetime.datetime(start_year, start_month_num, start_day_num), datetime.datetime(end_year, end_month_num, end_day_num))
    ax.grid(True)
    fig.autofmt_xdate()

    plt.xlabel('Month/Year')
    plt.ylabel('Cumulative Percent Growth')
    plt.title('%s and %s Cumulative Percent Growth' % (ts1, ts2))
    plt.legend()
    plt.savefig('plot.png', dpi=150)

    plt.show()

    wb = openpyxl.load_workbook(filepath)
    ws = wb.active    
    img = openpyxl.drawing.image.Image('plot.png')
    img.anchor(ws.cell(cell))
    ws.add_image(img)
    wb.save(filepath)

def plot_scatter_ts(df, ts1, ts2, filepath, cell):
    plt.xlabel('%s Price ($)' % ts1)
    plt.ylabel('%s Price ($)' % ts2)
    plt.title('%s and %s Price Scatterplot' % (ts1, ts2))
    plt.scatter(df[ts1], df[ts2])

    plt.show()

    wb = openpyxl.load_workbook(filepath)
    ws = wb.active
    plt.savefig('plot.png', dpi=150)    
    img = openpyxl.drawing.image.Image('plot.png')
    img.anchor(ws.cell(cell))
    ws.add_image(img)
    wb.save(filepath)

plot_results(back, 'adj_close_price4.0', 'adj_close_price26.0', filepath, 'P2')
plot_scatter_ts(back, 'adj_close_price4.0', 'adj_close_price26.0', filepath, 'P34')

Когда я запускаю функции plot_reults или plot_scatter_ts сами по себе, они запускаются и прекрасно переходят в Excel.Но если я запускаю их вместе, только последний прогон графика попадает в документ Excel, так что в этом случае точечная диаграмма.Более того, я не хочу видеть графики в интерфейсе Python, поэтому, если я избавлюсь от plt.show() в функции plot_results, график рассеяния по какой-то причине станет гистограммой, что странно, поскольку ни один из этих графиковэто гистограммы, и они в разных функциях.

Кто-нибудь знает, что я делаю неправильно?

Спасибо

Обновление 13/6/18

Извините, что был немного занят, у меня не было возможности вернуться к этому.

Как и предполагалось, я переписал свой код, используя Pandas xlsxwriter, как предложил Screenpaver.Но когда я пытаюсь сделать больше, чем один сюжет, он все равно кажется запутанным.Мой код ниже:

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import openpyxl

filepath = 'C:\...\Template.xlsx'


## Chart 1

def plot_results(df, ts1, ts2, sheet_name, filepath, cell):

    ## Create Pandas Excel writer using Xlswriter as the engine
    writer = pd.ExcelWriter(filepath, engine='xlsxwriter')
    back.to_excel(writer, sheet_name=sheet_name, startrow=1, startcol=1)

    ## Access the Xlswriter workbook and worksheets objects from the dataframe.
    workbook = writer.book
    worksheet = writer.sheets[sheet_name]

    ## Create a chart object 
    chart = workbook.add_chart({'type':'line'})

    ## Calculate extremes for axes
    min_x1 = back[ts1].min()
    max_x1 = back[ts1].max()
    min_x2 = back[ts2].min()
    max_x2 = back[ts2].max()    
    min_x = min(min_x1, min_x2)
    max_x = max(max_x1, max_x2)


    ## Configure the series of the chart from the dataframe data
    chart.add_series({
            'name':ts1,
            'categories': '=test!$D$3:$D502',
            'values':'=test!$C$3:$C502'
            })

    chart.add_series({
            'name':ts2,
            'categories': '=test!$D$3:$D502',
            'values':'=test!$E$3:$E502'
            })

    ## Configure chart axis
    chart.set_x_axis({'name':'Month/Year',
                      'date_axis':True,
                      'num_format': 'mm/yy', 
                      'major_gridlines':{
                              'visible':True,
                              'line':{'width':1, 'dash_type':'dash'}
                              }})
    chart.set_y_axis({'name':'Cumulative Percent Growth',
                      'min':min_x,
                      'max':max_x,
                      'major_gridlines':{
                              'visible':True,
                              'line':{'width':1, 'dash_type':'dash'}
                              }                  
                      })
    chart.set_title({'name':'%s and %s Cumulative Percent Growth' % (ts1, ts2)})

    chart.set_legend({'position':'bottom'})
    chart.set_chartarea({'border':{'none':True}})

    ## Insert chart into worksheet
    worksheet.insert_chart(cell, chart)

    writer.save()




## Chart 2
def plot_scatter_ts(df, ts1, ts2, sheet_name, filepath, cell):

    ## Create Pandas Excel writer using Xlswriter as the engine
    writer = pd.ExcelWriter(filepath, engine='xlsxwriter')
    back.to_excel(writer, sheet_name=sheet_name, startrow=1, startcol=1)

    ## Access the Xlswriter workbook and worksheets objects from the dataframe.
    workbook = writer.book
    worksheet = writer.sheets[sheet_name]


    ## Create a chart object 
    chart = workbook.add_chart({'type':'scatter'})


    min_x1 = back[ts1].min()
    max_x1 = back[ts1].max()
    min_x2 = back[ts2].min()
    max_x2 = back[ts2].max()    

    ## Configure the series of the chart from the dataframe data
    chart.add_series({
            #        'name':'Series1',
            'categories': 'test!$E$3:$E502',
            'values':'=test!$C$3:$C502'
            })


    ## Configure chart axis
    chart.set_x_axis({'name':ts1,
                          'min':min_x2,
                          'max':max_x2})
    chart.set_y_axis({'name':ts2,
                          'min':min_x1,
                          'max':max_x1})

    chart.set_title({'name':'%s and %s Price Scatterplot' % (ts1, ts2)})

    chart.set_legend({'none':True})
    chart.set_chartarea({'border':{'none':True}})

    ## Insert chart into worksheet
    worksheet.insert_chart(cell, chart)

    writer.save()

plot_scatter_ts(back, 'adj_close_price4.0', 'adj_close_price26.0', 'test2', filepath, 'Q18')

plot_results(back, 'series1', 'series2', 'test2', filepath, 'Q2')

По отдельности при запуске с другими закомментированными каждая функция работает нормально, но когда я запускаю обе функции, я получаю один смешанный график.

Спасибо

1 Ответ

0 голосов
/ 14 июня 2018

Спасибо, заставка заработала, переместив запись функций, как показано ниже:

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
import openpyxl

filepath = 'C:\...\Template.xlsx'
sheet_name='test'

writer = pd.ExcelWriter(filepath, engine='xlsxwriter')

## Chart 1

def plot_results(writer, df, ts1, ts2, sheet_name, filepath, cell):

    ## Create Pandas Excel writer using Xlswriter as the engine
    df.to_excel(writer, sheet_name=sheet_name, startrow=1, startcol=1)

    ## Access the Xlswriter workbook and worksheets objects from the dataframe.
    workbook = writer.book
    worksheet = writer.sheets[sheet_name]

    ## Create a chart object 
    chart = workbook.add_chart({'type':'line'})

    ## Calculate extremes for axes
    min_x1 = df[ts1].min()
    max_x1 = df[ts1].max()
    min_x2 = df[ts2].min()
    max_x2 = df[ts2].max()    
    min_x = min(min_x1, min_x2)
    max_x = max(max_x1, max_x2)


    ## Configure the series of the chart from the dataframe data
    chart.add_series({
            'name':ts1,
            'categories': '=test!$D$3:$D502',
            'values':'=test!$C$3:$C502'
            })

    chart.add_series({
            'name':ts2,
            'categories': '=test!$D$3:$D502',
            'values':'=test!$E$3:$E502'
            })

    ## Configure chart axis
    chart.set_x_axis({'name':'Month/Year',
                      'date_axis':True,
                      'num_format': 'mm/yy', 
                      'major_gridlines':{
                              'visible':True,
                              'line':{'width':1, 'dash_type':'dash'}
                              }})
    chart.set_y_axis({'name':'Cumulative Percent Growth',
                      'min':min_x,
                      'max':max_x,
                      'major_gridlines':{
                              'visible':True,
                              'line':{'width':1, 'dash_type':'dash'}
                              }                  
                      })
    chart.set_title({'name':'%s and %s Cumulative Percent Growth' % (ts1, ts2)})

    chart.set_legend({'position':'bottom'})
    chart.set_chartarea({'border':{'none':True}})

    ## Insert chart into worksheet
    worksheet.insert_chart(cell, chart)





## Chart 2
def plot_scatter_ts(writer, df, ts1, ts2, sheet_name, filepath, cell):

    ## Create Pandas Excel writer using Xlswriter as the engine
    df.to_excel(writer, sheet_name=sheet_name, startrow=1, startcol=1)

    ## Access the Xlswriter workbook and worksheets objects from the dataframe.
    workbook = writer.book
    worksheet = writer.sheets[sheet_name]


    ## Create a chart object 
    chart = workbook.add_chart({'type':'scatter'})


    min_x1 = df[ts1].min()
    max_x1 = df[ts1].max()
    min_x2 = df[ts2].min()
    max_x2 = df[ts2].max()    

    ## Configure the series of the chart from the dataframe data
    chart.add_series({
            #        'name':'Series1',
            'categories': 'test!$E$3:$E502',
            'values':'=test!$C$3:$C502'
            })


    ## Configure chart axis
    chart.set_x_axis({'name':ts1,
                          'min':min_x2,
                          'max':max_x2})
    chart.set_y_axis({'name':ts2,
                          'min':min_x1,
                          'max':max_x1})

    chart.set_title({'name':'%s and %s Price Scatterplot' % (ts1, ts2)})

    chart.set_legend({'none':True})
    chart.set_chartarea({'border':{'none':True}})

    ## Insert chart into worksheet
    worksheet.insert_chart(cell, chart)




plot_scatter_ts(writer, back, 'series1', 'series2', sheet_name, filepath, 'Q18')

plot_results(writer, back, 'series1', 'series2', sheet_name, filepath, 'Q2')

writer.save()
...