Как эффективно создать хеш-таблицу для хранения большой последовательности слов? - PullRequest
0 голосов
/ 26 января 2012

Я хочу найти наиболее часто встречающиеся слова из большой последовательности слов. Пожалуйста, помогите мне создать эффективную хэш-таблицу для этого

Ответы [ 2 ]

0 голосов
/ 26 января 2012

Я бы использовал минимальную кучу размером k здесь вместо хеш-таблицы.Просто добавьте слова в кучу с их соответствующей длиной - как только у вас будет k + 1 элементов в куче, удалите минимальный элемент и заново подогрейтеОбщее усилие будет O (n * log (k)), и вам потребуется O (k) дополнительного пространства (для поддержания кучи).

0 голосов
/ 26 января 2012

Разделите вашу строку на массив строк по пробелам или любым другим разделителям, а затем поместите ее в HashMultiset

тогда вы можете просто получить количество для каждого слова.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...