Лучшие алгоритмы поиска, чтобы найти слово из миллионов слов в Java - PullRequest
2 голосов
/ 08 марта 2019

Недавно в одном из интервью меня спросили , какую структуру данных / библиотеку вы бы использовали для поиска определенного слова среди многомиллионных слов .

Я сказал, HashSet, поскольку он выполняет операцию поиска, в среднем, почти за постоянное время.Я также упомянул, что мы должны инициализировать его с двойным известным числом элементов , так что у меня будет меньшее коллизия хешей, поскольку нагрузка будет разделена между большим количеством блоков, а отдельный связанный список будет иметь половинуразмер (это действительно улучшит производительность?).Но опять же, интервьюер спросил меня, будет ли этого достаточно, и ожидал чего-то большего.

Что еще мы можем сделать, чтобы достичь более высокого уровня поисковой оптимизации или любой другой структуры данных / библиотеки, которая может помочь повысить эффективность?

...