Java Spark, как сохранить JavaPairRDD <HashSet <String>, HashMap <String, Double >> в файл? - PullRequest
0 голосов
/ 27 апреля 2018

Я получил этот "JavaPairRDD<HashSet<String>, HashMap<String, Double>>" RDD после некоторых сложных агрегаций, хочу сохранить результат в файл. Я считаю, что saveAsHadoopFile - хороший API для этого, но у меня проблемы с заполнением параметров для saveAsHadoopFile(path, keyClass, valueClass, outputFormatClass, CompressionCodec). Кто-нибудь может помочь?

1 Ответ

0 голосов
/ 27 апреля 2018

Вы можете использовать следующую функцию, а затем проанализировать ее до желаемого результата.

rdd.saveAsTextFile ("hdfs:///complete_path_to_hdfs_file/");

но если вы хотите использовать API saveAsHadoopFile, то можно использовать следующий метод.

saveAsHadoopFile(complete_path_to_file, HashSet.class, HashMap.class, TextOutputFormat.class)

Вы также можете использовать HadoopOutputFormat.class в качестве последнего параметра

Для получения дополнительной информации вы можете обратиться по этой ссылке HadoopFile

...