Настраиваемая Java-программа для подсчета количества слов с использованием hadoop - PullRequest
1 голос
/ 13 мая 2019

Новое в Hadoop!Я пытаюсь изменить код программы wordcount для вывода только тех слов, которые начинаются с "a", например.

Я изменил код метода mapper, но по неизвестным причинам он по-прежнему выводит все словаво входном файле.Остальная часть кода не изменилась и может быть найдена в https://docs.microsoft.com/en-us/azure/hdinsight/hadoop/hdinsight-use-mapreduce.

public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {
        Text word = new Text();
        StringTokenizer itr = new StringTokenizer(value.toString());
        while (itr.hasMoreTokens()) {
            String currentWord = itr.nextToken();
            if(currentWord.startsWith("a")) {
                word.set(currentWord);
                context.write(word, new IntWritable(1));
            }
        }
}

Выходной файл все еще содержит все слова.Я ожидал только слова, начинающиеся с буквы - а.

Любая помощь будет оценена.Заранее спасибо.

...