<tag k="addr:street" v="St. Croix gate"/>
public void map(Object key, Text value, Context context
) throws IOException, InterruptedException {
StringTokenizer itr = new StringTokenizer(value.toString());
while (itr.hasMoreTokens()) {
String cb = itr.nextToken();
if(cb.contains("k=\"addr:street\"")){
String roadName = itr.nextToken();
while(!roadName.contains("\"/>")) {
roadName = roadName + itr.nextToken();
}
word.set(roadName);
context.write(word, one);
}
}
}
}
Итак, как вы можете видеть, я пытаюсь получить строку внутри v = "St. Croix Gate" />, но так как Tokenizer добавляет новый токен для каждого пробела, ятолько получая на выходе "ворота"