Как мне создать PairRDD? - PullRequest
       12

Как мне создать PairRDD?

0 голосов
/ 16 октября 2018

Мне нужно создать PairRDD (draft_ids), где key - это идентификатор проекта, а value - это все поля, полученные с помощью метода split.У нас есть rdd проект

draft.take(3).foreach(println)

[Ljava.lang.String;@302bf7bb
[Ljava.lang.String;@3128929f
[Ljava.lang.String;@30037ad7

1 Ответ

0 голосов
/ 17 октября 2018

Вам необходимо вызвать функцию mapToPair, которая возвращает кортеж, например, в python:

def myMap2pair(element):
    key = element.getKey()
    value = element.getValue()
    return key, value

draftKV = draft.map(myMap2pair)
...