Взрывать объекты JavaPairRDD - PullRequest
0 голосов
/ 11 июля 2019

У меня есть JavaPairRDD<Dimension, Metrics>, здесь Dimension и Metrics объекты имеют несколько членов.Есть ли способ преобразовать это в Dataset<Row> со всеми столбцами / членами обоих объектов.Или есть также способ вывести этот JavaPairRDD в файл со столбцами / членами обоих объектов, разделенных табуляцией или запятой.

1 Ответ

0 голосов
/ 11 июля 2019

Вы можете использовать преобразование map () для преобразования JavaPairRDD в JavaRDD, представляющий все члены Dimension и Metrics в виде строки, разделенной запятыми.

После этого вы можете сохранить его как текстовый файл .

Логические шаги для этого:

  • Переопределить toString () в классах Dimension и Metrics.Вы можете вернуть список значений через запятую в виде строки.

В вашем искровом приложении -

Function<Tuple2<Dimension, Metrics>, String> f = tuple -> (tuple._1.toString() +"," + tuple._2.toString());
JavaRDD csvRdd = pairRDD.map(f);
csvRdd.saveAsTextFile("your file path")
  • Амит
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...