Есть ли способ преобразовать искровой фрейм данных, сгенерированный из оператора SQL в RDD? - PullRequest
0 голосов
/ 11 ноября 2018

если я использую этот иск SQL:

df = spark.sql('SELECT col_name FROM table_name')

вернет объект данных в искровом кадре. Как я могу преобразовать это в RDD? Есть ли способ прочитать таблицу напрямую, используя sql, но генерируя rdd вместо фрейма данных?

Заранее спасибо

1 Ответ

0 голосов
/ 11 ноября 2018
df = spark.sql('SELECT col_name FROM table_name')

df.rdd # вы можете сохранить его, выполнить преобразования и т. Д.

df.rdd возвращает содержимое в виде pyspark.RDD строки.

Затем вы можете отобразить на этой RDD Строку, преобразовав каждую Строку в numpy вектор. Я не могу быть более конкретным в отношении преобразования, так как не знаю, что представляет ваш вектор с предоставленной информацией.

Примечание 1 : df - это переменная, определяющая наш Dataframe.

Примечание 2 : эта функция доступна с версии Spark 1.3

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...