Добавить строку к паре RDD в спарк - PullRequest
0 голосов
/ 19 октября 2018

У меня есть пара СДР из существующих значений, таких как: (1,2) (3,4) (5,6)

Я хочу добавить строку (7,8) к тому же СДР

Как я могу добавить к тому же RDD в Spark?

1 Ответ

0 голосов
/ 19 октября 2018

Вы можете использовать операцию объединения.

scala> val rdd1 = sc.parallelize(List((1,2), (3,4), (5,6)))
q: org.apache.spark.rdd.RDD[(Int, Int)] = ParallelCollectionRDD[1] at parallelize at <console>:24

scala> val rdd2 = sc.parallelize(List((7, 8)))
q: org.apache.spark.rdd.RDD[(Int, Int)] = ParallelCollectionRDD[1] at parallelize at <console>:24

scala> val unionOfTwo = rdd1.union(rdd2)
res0: org.apache.spark.rdd.RDD[(Int, Int)] = UnionRDD[2] at union at <console>:28
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...