У меня есть RDD с другим набором значений, и я хочу вернуть все отдельные наборы из исходного RDD. Есть ли какой-нибудь ключевой термин, например, отличный?
example = sc.parallelize([{1}, {2}, {3}, {1}])
example.collect()
Это выводит:
[{1}, {2}, {3}, {1}]
Я пытался example.distinct().collect()
, и я ожидал ответа на СДР с различными наборами:
[{1}, {2}, {3}] # expected result
Есть ли способ сделать это?