Нужна помощь в подсчете букв в javardd - PullRequest
0 голосов
/ 19 июня 2019

Мне нужно создать программу подсчета букв в java spark, используя JavaRDD, как java Wordcount.Но я не знаю, как будет использоваться условие разделения для разделения / вычисления вхождения каждой буквы в абзаце.Пожалуйста, помогите мне с рабочим примером в java spark заранее спасибо.Рабочий код для моего javawordcount приведен ниже ...

 JavaRDD<String> wordsFromFile = inputFile.flatMap(content -> Arrays.asList(content.split(" ")));

        JavaPairRDD countData = wordsFromFile.mapToPair(t -> new Tuple2(t, 1)).reduceByKey((x, y) -> (int) x + (int) y);

//The above condition is used for word count

1 Ответ

0 голосов
/ 19 июня 2019

Для подсчета символов мы можем использовать content.split ("")

 JavaRDD<String> wordsFromFile = inputFile.flatMap(content -> Arrays.asList(content.split("")));

Он предоставит счетчик каждого символа, встречающегося в контенте. Если вы хотите, чтобы только буквы (алфавиты) использовали фильтр.

...