Вирус не в "антивирус" с Solr - PullRequest
0 голосов
/ 11 июня 2019

У меня проблема, мне нужно запросить solr со слабым not (- знак) Например, я хочу документы, содержащие вирус, но мне нет дела до антивируса. Запрос типа: вирус - «антивирус», удалит документы, которые могут содержать вирус и «антивирус», но я хочу удалить только документы, которые содержат только «антивирус» без вируса.

Обратите внимание, что вирус - «антивирус» - это просто пример, это может быть любое слово и фраза, содержащая это слово.

1 Ответ

0 голосов
/ 11 июня 2019

Здесь довольно много сценариев, и если вам абсолютно необходимо найти документы, которые содержат «вирус», только когда они автономны и не помечены другими словами, вам нужно выполнить некоторую обработку индекса, возможно, заменив «антивирус»с антивирусом или другой несовпадающей комбинацией.Это предполагает, что вы знаете, что такое комбинации во время индексации.

Проще сказать, что вы хотите показать все документы, но хотите обновить те, которые содержат автономный термин «вирус».Или, более конкретно, понизьте те, которые содержат термин «антивирус».Таким образом, на первом месте стоят документы, содержащие только «вирусные» термины, за которыми следуют документы, содержащие как отдельные, так и комбинированные термины, а затем - документы, содержащие только комбинированные термины.Это может быть достигнуто с помощью:

вирус "антивирус" ^ - 10

^ здесь усиление, и вы даете ему отрицательные значения.Таким образом, любой совпадающий составной термин приведет к падению документа в рейтинге.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...