Как отследить дерево в писпарке RDD? - PullRequest
0 голосов
/ 07 сентября 2018

Постановка задачи

При этом приведены пример и ожидаемый результат. Дерево описывается тремя столбцами (глубина дерева - динамическая), а связь существует в столбцах. Необходимо ввести их в один ряд ключом pyspark RDD. Любая идея будет оценена? Спасибо.

Пример СДР:

(null,a1,null)
(null,a2,a1)
(null,a3,a2)
(null,a4,a3)
(b1,null,a4)

Ожидаемый результат

b1->a4->a3->a2->a1, result RDD: (b1,(a4,a3,a2,a1))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...