Я выполняю сопоставление строк с большим количеством данных.
РЕДАКТИРОВАТЬ: я сопоставляю слова, содержащиеся в большом списке, с некоторыми текстовыми файлами онтологии. Я беру каждый файл из онтологии и ищу соответствие между третьей строкой каждой строки файла и любым словом из списка.
Я допустил ошибку, наблюдая за тем, что мне нужно не просто сопоставление (результаты плохие), но мне нужна более слабая функция сопоставления, которая также будет возвращать результаты, когда строка содержится внутри другой строки.
Я сделал это с Radix Trie ; это было очень быстро и хорошо работает, но теперь я думаю, что моя работа бесполезна, потому что три возвращает только точные совпадения. : /
- Тип алгоритмов, которые делают это, являются алгоритмами поиска строк?
- Может ли кто-нибудь предложить некоторые реализации Java, с которыми у него есть опыт?
Алгоритм должен быть быстрым, но он не является главным приоритетом, он сочетается со скоростью и сложностью.
Я очень благодарен за все советы / примеры / объяснения / ссылки!
Спасибо!