Класс строкового токенизатора позволяет разбить строку на токены, но он не может помочь вам вычислить частоты каждого слова. Для этого, например, вы можете использовать структуру Map
для хранения String
слова и Integer
частоты. В следующем примере я использую TreeMap
, потому что таким образом я могу печатать слова и частоты, используя лексикографический порядок слов c.
Map<String, Integer> freq = new TreeMap<>();
for (String word : words) {
int count = freq.containsKey(word) ? freq.get(word) : 0;
freq.put(word, count + 1);
}
for (String word: freq.keySet()) {
System.out.println(word + " = "+ freq.get(word));
}