Параметр стемминга в Solr - PullRequest
       25

Параметр стемминга в Solr

0 голосов
/ 16 октября 2018

Есть ли какие-либо параметры, такие как (edismax или dismax или любой другой), которые я могу установить для стемминга для работы в Solr, или мне нужно внести изменения в schema.xml в Solr для реализации стемминга?Проблема в том, что если я по умолчанию изменяю schema.xml, я не хочу?Я использую Solr из стороннего приложения, и в пользовательском интерфейсе у нас есть флажок для определения / снятия флажка, я передаю эти параметры Solr и получаю данные из Solr, я не могу передать этот параметр пользовательского интерфейса в SOlr, поэтому, если есть какой-либо параметр вSolr сторона, я могу передать это для того, чтобы остановить работу?

Пожалуйста, дайте мне знать?

1 Ответ

0 голосов
/ 16 октября 2018

Стемминг выполняется как часть цепочки анализа, и поэтому является частью того, как определяется схема для этого конкретного поля.

Причина этого становится очевидной, когда вы рассматриваете, как работает стемминг - дляВ этом смысле термин должен быть ограничен , когда он индексируется , а также при запросе.

Lucene берет вашу входную строку, пропускает ее по цепочке анализа и сохраняет сгенерированные токены в своем индексе.Если вы дадите ему what are you asking, то, скорее всего, получите what, are, you, ask после токенизации с помощью пробела и применения стемминга.

Та же самая операция происходит при запросе, поэтому, если кто-то ищет asks, токен получает значение ask - и затем сравнивается с тем, что находится в индексе.Если бы при индексации не было стемминга, в итоге вы бы получили asking в индексе и ask при запросах - и это не совпадение, поскольку токены не совпадают.

В стороннем приложении опция стемминга, вероятно, выполняет стеммирование внутри приложения перед отправкой содержимого в Solr.

Вы также можете использовать API-интерфейс Schema для динамического обновления и изменения определений типов полей .

...