Чтобы объединить ключ значения: значение RDD, имеющее общий ключ - PullRequest
0 голосов
/ 29 мая 2019

Я новичок в использовании Python, так что простите, если вопрос звучит просто. Если у меня есть СДР:

[(((1, 0), 0.0), (2, 0)),
 (((1, 0), 0.0), (3, 0)),
 (((2, 0), -0.0), (1, 0)),
 (((2, 0), -0.0), (3, 0)),
 (((3, 0), -0.0), (1, 0)),
 (((3, 0), -0.0), (2, 0))]  

Я хочу объединить значения, имеющие общий ключ. Так что в основном мой вывод должен быть -

[(((1, 0), 0.0), [(2, 0),(3,0)])
 (((2, 0), -0.0), [(1, 0),(3,0)])
 (((3, 0), -0.0), [(1, 0),(2,0)])]  

Я пытался использовать groupByKey(), но все еще не смог получить решение. Любая помощь будет благодарна. Спасибо.

1 Ответ

0 голосов
/ 29 мая 2019

Это должно сработать: rdd.groupByKey().mapValues(list).collect()

...