Новое в Hadoop!Я пытаюсь изменить код программы wordcount для вывода только тех слов, которые начинаются с "a", например.
Я изменил код метода mapper, но по неизвестным причинам он по-прежнему выводит все словаво входном файле.Остальная часть кода не изменилась и может быть найдена в https://docs.microsoft.com/en-us/azure/hdinsight/hadoop/hdinsight-use-mapreduce.
public void map(Object key, Text value, Context context
) throws IOException, InterruptedException {
Text word = new Text();
StringTokenizer itr = new StringTokenizer(value.toString());
while (itr.hasMoreTokens()) {
String currentWord = itr.nextToken();
if(currentWord.startsWith("a")) {
word.set(currentWord);
context.write(word, new IntWritable(1));
}
}
}
Выходной файл все еще содержит все слова.Я ожидал только слова, начинающиеся с буквы - а.
Любая помощь будет оценена.Заранее спасибо.