После некоторых преобразований у меня получился rdd со следующим форматом:
[(0, [('a', 1), ('b', 1), ('b', 1), ('b', 1)])
(1, [('c', 1), ('d', 1), ('h', 1), ('h', 1)])]
Я не могу понять, как по существу "reduByKey ()" в части значений этого rdd.
Это то, чего я хотел бы достичь:
[(0, [('a', 1), ('b', 3)])
(1, [('c', 1), ('d', 1), ('h', 2)])]
Я изначально использовал .values (), затем применял к нему результат ReduByKey, но потом я потерял свой оригинальный ключ (в этом случае 0 или 1).