Создать основанный на столбцах фрейм данных из двух RDD в pyspark - PullRequest
1 голос
/ 25 февраля 2020

У меня есть два RDD. Каждая из них является парой ключ-значение:

rdd1:

('a', 1)
('b', 2)

rdd2:

('a', 3)
('c', 2)

Я хочу объединить их в pyspark sql dataframe такой что:

        a   b   c
rdd1    1   2   0
rdd2    3   0   2

Есть ли способ сделать это? Или мне нужно изменить способ создания моих rdd1 и rdd2?

Спасибо

...