сохранение содержимого df.show () в виде строки в pyspark - PullRequest
0 голосов
/ 05 октября 2018
from pyspark.sql import SparkSession

sc = SparkSession.builder.getOrCreate()
prsn = sc.read.format("csv").option("delimiter", ",").option("header", "true").option("inferSchema", "true").load("C:/Users/amit.suar/IdeaProjects/LearningPyspark/prsn.csv")

prsn.show()

+-------------------------+------------------------+---+-----------+-----------------------------+
|PERSON_MEDIA_CONSUMER_KEY|PERSON_MEDIA_CONSUMER_ID|AGE|GENDER_CODE|EDUCATION_LEVEL_CATEGORY_CODE|
+-------------------------+------------------------+---+-----------+-----------------------------+
|                      101|                 3285854| 15|          1|                            1|
|                      102|                 2313090| 25|          1|                            3|
|                      103|                 2295854| 33|          2|                            6|
|                      104|                 2295854| 33|          2|                            6|
|                      105|                 2471554| 26|          2|                            4|
|                      106|                 2471554| 26|          2|                            4|
+-------------------------+------------------------+---+-----------+-----------------------------+

я хочу записать этот вывод в виде строки в переменной .. как я могу добиться этого?

1 Ответ

0 голосов
/ 05 октября 2018

Существует внутренняя / приватная функция, которая возвращает ту же строку, что и .show() print:

# Return dataframe as a table of first n records (20 by default)
dataframe._jdf.showString(n, 20)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...