У меня есть два RDD. Каждая из них является парой ключ-значение:
rdd1:
('a', 1)
('b', 2)
rdd2:
('a', 3)
('c', 2)
Я хочу объединить их в pyspark sql dataframe такой что:
a b c
rdd1 1 2 0
rdd2 3 0 2
Есть ли способ сделать это? Или мне нужно изменить способ создания моих rdd1 и rdd2?
Спасибо