Question

У меня есть код, в котором я сравниваю большие данные, скажем, источник веб-страницы с некоторыми словами в файле. Какой алгоритм лучше всего использовать?

Может быть 2 сценария:

Если у меня есть большое количество слов для сравнения с источником, то в этом случае для обычного алгоритма поиска строки потребуется слово, сравнить с данными, взять следующее и сравнить данные и так далее, пока все не будет завершено.
У меня есть только пара слов в файле, и нормальный поиск строки будет в порядке, но все равно необходимо максимально сократить время.

Какой алгоритм лучше? Я знаю про Бойера-Мура, а также алгоритмы поиска Рабина-Карпа. Хотя поиск Бойера-Мура кажется быстрым, я также хотел бы назвать имена других алгоритмов и их сравнения.

Matthieu M. · Answer 1 · 04 ноября 2011

Обратите внимание, что Бойер-Мур должен искать текст ( несколько слов) в тексте.

Если все, что вам нужно, это определить отдельные слова, тогда гораздо проще:

положить каждое найденное слово в структуру словаря (чем бы оно ни было)
поиск каждого слова в словаре

Это наиболее заметно означает, что вы читаете текст как поток, и вам не нужно хранить его все в памяти сразу (что прекрасно работает с типичным примером файлового курсора).

Что касается структурысловаря, я бы порекомендовал простую хеш-таблицу.Прекрасно работает с памятью по сравнению с древовидными структурами.

Anthony Blake · Answer 2 · 04 ноября 2011

В обоих случаях, я думаю, вы, вероятно, захотите построить патрицию (также называемую основанием)Самое важное, что время поиска будет O (k), где k - максимальная длина строки в дереве.

Лучший алгоритм поиска строк

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Лучший алгоритм поиска строк

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы