Родная прорисовка в Apache Spark - PullRequest
0 голосов
/ 11 февраля 2020

Есть ли собственный способ создания графика в Spark SQL (в записной книжке Jupyter)?

Давайте создадим, например, Spark DataFrame с 10k записями и добавим столбец со случайным (обычный) ) числа:

from pyspark.sql import SparkSession
from pyspark.sql.functions import randn

spark = SparkSession.builder.master("local")\
                            .appName("TestPlot")\
                            .getOrCreate()

df = spark.range(10000)
df = df.withColumn('randn', randn(seed=42))

Есть ли собственный способ создания, скажем, гистограммы, без необходимости конвертировать pyspark.sql.dataframe.DataFrame в pandas.core.frame.DataFrame и затем с использованием matplotlib?

import matplotlib.pyplot as plt
%matplotlib inline
df.select('randn').toPandas().hist(bins=42)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...