SOLR: Настройка индекса синонимов времени - PullRequest
1 голос
/ 02 марта 2012

Я пытаюсь заставить работать синонимы корректно, я хочу сопоставить блокировщик этажа с хранилищем хранения

В настоящее время поиск блокировщика хранения приводит к результатам, так как поиск блокировщика этажа не дает никаких результатов.У меня есть следующие настройки для синонимов индекса времени:

<fieldType name="text" class="solr.TextField" positionIncrementGap="100" omitNorms="false">
    <analyzer type="index">
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" tokenizerFactory="KeywordTokenizerFactory"/>
        <charFilter class="solr.HTMLStripCharFilterFactory"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" />
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
        <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
        <filter class="solr.LowerCaseFilterFactory" />
        <filter class="solr.RemoveDuplicatesTokenFilterFactory" />
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
      </analyzer>
......

И мой synonyms.txt выглядит так:

floor locker=>storage locker

Что я делаю не так?

1 Ответ

1 голос
/ 10 апреля 2012

Неверный порядок цепочки анализа. Сначала вы должны установить фильтр символов, затем токенизатор. Фильтр синонимов может быть сразу после этого. Остальные фильтры расположены в правильном порядке или, по крайней мере, в хорошем порядке.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...