random42 = sorted(['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q','R','S','T','U','V','W','X','Y'])
Требуется выход ncr, чтобы иметь комбинацию из трех меток в коде pyspark
['AAA', 'AAB', 'AAC', 'AAD', 'AAE', 'AAF', «AAG», «AAH», «AAI», «AAJ», «AAK», «AAL», «AAM», «AAN», «AAO», «AAP», «AAQ», «AAR», «AAS ',' BAA ',' BAB ',' BAC ',' BAD ',' BAE ',' BAF ',' BAG ',' BAH ',' BAI ',' BAJ ',' BAK ',' BAL ', «BAM», «BAN», «BAO», «BAP», «BAQ», «BAR», «BAS», «BAT», «BAU», «BAV» ... «YYT», «YYU», 'YYV', 'YYW', 'YYX', 'YYY']
>>> rdd = sc.parallelize([1, 2])
>>> sorted(rdd.cartesian(rdd).collect())
[(1, 1), (1, 2), (2, 1), (2, 2)]
Мне нужна трехбуквенная комбинация типа
>>> rdd = sc.parallelize([1, 2, 3, 4, 5])
>>> sorted(rdd.cartesian(rdd).collect())
[(1, 2, 3), (1, 2, 4), (2, 3, 4), (2,3,5)]
Я смотрю в pyspark, так какУ меня есть более 1000 в качестве моих элементов, чтобы выбрать 1000 C_3