Как я могу перебрать столбец искрового фрейма данных и получить доступ к значениям в нем по одному? - PullRequest
0 голосов
/ 13 ноября 2018

У меня есть искровой датафрейм Вот оно

Я хотел бы получить значения столбца одно за другим, и мне нужно присвоить его какой-то переменной? Как это можно сделать в pyspark. ясность в вопросе

Ответы [ 2 ]

0 голосов
/ 13 ноября 2018
col1=df.select(df.column_of_df).collect()
list1=[str(i[0]) for i in col1]
#after this we can iterate through list (list1 in this case)
0 голосов
/ 13 ноября 2018

Я не совсем понимаю, о чем вы спрашиваете, но если вы хотите сохранить их в переменной вне тех фреймов данных, которые предлагает Spark, лучший вариант - выбрать нужный вам столбец и сохранить его как серию панд ( если их не много, потому что ваша память ограничена).

from pyspark.sql import functions as F

var = df.select(F.col('column_you_want')).toPandas()

Тогда вы можете повторять его, как обычный ряд панд.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...