Я использую Solr 8.3 и пытаюсь передать файл синонима в формате wor dnet, например, -
s (300880586,1, 'augmented', s, 1 , 0).
с (300880765,1, «расширенный», с, 1,0).
с (300881030,1, «гиперболи c», с, 1, 2).
s (300881030,2, 'inflated', s, 1,1).
В файле управляемой схемы я настроил Фильтр графика синонимов as-
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100" multiValued="true">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
<filter class="solr.SynonymGraphFilterFactory" synonyms="wn_s.pl" format="wordnet" ignoreCase="true"/>
<filter class="solr.FlattenGraphFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
<filter class="solr.SynonymGraphFilterFactory" synonyms="wn_s.pl" format="wordnet" expand="true" ignoreCase="true" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
Однако это не сработало. Возможно, я пропустил какую-то конфигурацию или, возможно, какую-то проблему с форматом.
Поэтому я попытался преобразовать файл в формат Solr, он как-то работает.
Я хотел использовать wor dnet только в формате, так что если кто-то может помочь мне понять ошибку, которую я здесь совершаю, это будет полезно.