Используйте Lucene, если вы хотите проиндексировать текстовые документы (любой длины) и найти в этих документах Текст , возвращая ранжированный список документов, соответствующих поисковому запросу. Классическим примером являются поисковые системы, такие как Google, которые используют текстовые индексаторы, такие как Lucene, для индексации и запроса содержимого веб-страниц.
Преимущества использования Lucene над базой данных, такой как Mysql, дляИндексирование и поиск текста:
- для разработчика - инструменты для анализа, синтаксического анализа и индексации текстовой информации (например, stemming, множественное число, синонимы, токенизация) на нескольких языках.Lucene также очень хорошо масштабируется для текстового поиска.
- для пользователя - качественные результаты поиска.Lucene использует очень хорошую функцию сходства (для сравнения поискового запроса с каждым документом), в основе которой лежат косинусное сходство и частота обратного термина / документа.Это приводит к хорошим результатам поиска с минимальной предварительной настройкой.
Много полезной информации о Lucene здесь .