Постановка задачи
При этом приведены пример и ожидаемый результат. Дерево описывается тремя столбцами (глубина дерева - динамическая), а связь существует в столбцах.
Необходимо ввести их в один ряд ключом pyspark RDD
. Любая идея будет оценена? Спасибо.
Пример СДР:
(null,a1,null)
(null,a2,a1)
(null,a3,a2)
(null,a4,a3)
(b1,null,a4)
Ожидаемый результат
b1->a4->a3->a2->a1, result RDD: (b1,(a4,a3,a2,a1))