ValueError: установка элемента массива с последовательностью при построении линейного графика с использованием pyspark в zeppelin - PullRequest
0 голосов
/ 20 декабря 2018

В настоящее время у меня есть этот фрейм данных (df):

    +-------------------+--------+
    |       datetime_new|pkts_new|
    +-------------------+--------+
    |2018-01-04 00:00:00|    47.0|
    |2018-01-04 00:00:00|     1.0|
    |2018-01-04 00:00:00|     3.0|
    |2018-01-04 00:00:00|    40.0|
    |2018-01-04 00:01:00|     1.0|
    |2018-01-04 00:01:00|     1.0|
    |2018-01-04 00:01:00|     1.0|
    |2018-01-04 00:01:00|    49.0|
    |2018-01-04 00:01:00|    33.0|
    |2018-01-04 00:01:00|     2.0|
    +-------------------+--------+

`DataFrame[datetime_new: timestamp, pkts_new: double]`

type(t): <class 'pyspark.sql.dataframe.DataFrame'>

Я хочу построить линейный график, где ось x - это datetime_new, а ось y - pkts_new.Однако, когда я использовал эту команду: plt.plot(df.select('datetime_new'),df.select('pkts_new')), я получу сообщение об ошибке: ValueError: setting an array element with a sequence.

Как построить график для?

1 Ответ

0 голосов
/ 20 декабря 2018

Преобразование массива в список с использованием списка (myarray)

import matplotlib.pyplot as plt    
plt.plot(data_time,time)
plt.show()
...