У меня есть база данных с большим количеством книг. У меня есть такие поля, как название, описания, авторы и т. Д.
Я индексирую заголовок с повышением 100f и описание с усилением 0,1f, оба поля имеют токены и стволовые.
Я ищу в одном поле ввода, которое ищет во всех доступных полях, используя логический запрос, объединенный с BooleanClause.Occur.SHOULD и содержащий шаблонный запрос для каждого поля. Я также удаляю все «стоп-слова» из запроса для начала.
Проблема, с которой я сталкиваюсь, заключается в том, что я ищу строку без кавычек
"de wetenschap van het leven", после удаления стоп-слов я получаю "wetenschap leven"
Запрос на заголовок становится "*wetenschap
* *leven
*", запрос на описание такой же, с булевым запросом переноса, объединенным с BooleanClause.Occur.SHOULD.
Следующие книги находятся в БД
- Wetenschappelijk denken. Een
Inleiding voor de medische en
biomedische wetenschappen en voor de
andere levenswetenschap.
- De
wetenschap van de aarde. Более чем
Levende Planet
- Атлас ван де
menselijke levensloop
- De wetenschap
Ван Хет Левен. За эненхейд в
биологический диверсиит
Книга вернулась в первые 4 книги, это хорошо, но в этой реализации мы обрезали по 3, а остальные ниже ссылки «читать дальше». Просто увеличить отсечение не вариант
Для меня книга "De wetenschap van het leven. Over eenheid in biologische diversiteit" соответствует запросу "больше", чем другим (или мне так кажется), но я не могу найти правильную комбинацию индекс / поиск чтобы сделать эту работу. У кого-нибудь есть идея?