Spark: получить комбинации заданной длины - PullRequest
0 голосов
/ 10 апреля 2019

Как получить rdd с несколькими кортежами, как получить все комбинации заданной длины? Скажи, что у меня есть

from pyspark import SparkConf, SparkContext
conf = SparkConf()
sc = SparkContext(conf = conf)
elements = sc.parallelize([('A','B'), ('D','E'), ('G','H')])

и некоторый параметр длины, скажем length=3

Я бы хотел получить

res = [('A','B','D'), ('A','B','E'), ('A','B','G'), ('A','B','H'), ('D','E','G'), ('D','E','H')]

Я нашел этот предыдущий пост , но, к сожалению, ни один из ответов не решает проблему предопределенной длины.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...