Как использовать matplotlib для вывода результатов pyspark sql для каждой строки? - PullRequest
0 голосов
/ 06 июля 2018

У меня есть таблица в улье, которую я использую для создания фрейма данных.Столбец таблицы:

[mer_name, год, месяц, sum_qty, sum_ln, sum_orders]

Я хочу построить график, который будет содержать sum_orders для всех месяцев mer_name.что-то вроде этого:

https://assets.digitalocean.com/articles/eng_python/pandas/name_plot-m-list.png

Я пытался с Matplotlib, но я не могу построить.

код:

dataDF=sqlContext.sql("select * from db.testtable where year = 
                      2015")
pdDF = dataDF.toPandas()
ax=pdDF.plot(x=['mer_name','month'], y='sum_orders', 
               rot=45)
fig = ax.get_figure()
fig.savefig('demo.pdf')

Также попытался сделать сводную таблицу, но у меня это не сработало.

код:

 df=pd.pivot_table(pdDF,index= 
                    ["mer_name","year","month"],values= 
                    ["sum_orders"])
 ax=df.plot(rot=45)
 fig = ax.get_figure()
 fig.savefig('pivot')  

пожалуйстапомощь.

заранее спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...