Читать содержимое каталога в Spark - PullRequest
0 голосов
/ 16 сентября 2018

Я новичок в Spark, просто хотел узнать, как мы можем читать содержимое каталога и перебирать его. C # соответствующий код

Foreach(var path in Directory. EnumerateFiles(directory, *,.. ) {} ;

1 Ответ

0 голосов
/ 16 сентября 2018
  JavaSparkContext jsc = new JavaSparkContext(sc);
  JavaPairRDD<String,String> rdd = jsc.wholeTextFiles(path);
          for(Tuple2<String, String> str : rdd.toArray()) {           System.out.println("+++++++++++++++++++++++++++++++++++++++++++");
      System.out.println("File name " + str._1);
      System.out.println("+++++++++++++++++++++++++++++++++++++++++++");
      System.out.println();
      System.out.println("-------------------------------------------");
      System.out.println("content " + str._2);
      System.out.println("-------------------------------------------");
  }

Надеюсь, это поможет, у меня был тот же вопрос.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...