Подсветка Solr: InvalidTokenOffsetsException - PullRequest
2 голосов
/ 21 сентября 2011

Я использую Solr 3.4. Когда я ищу слово, у меня есть InvalidTokenOffsetsException. Мой тип поля выглядит так:

    <fieldType name="text" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
                    <filter class="solr.ASCIIFoldingFilterFactory"/>
        <filter class="solr.EdgeNGramFilterFactory" minGramSize="3" maxGramSize="15" />
        <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
                    <filter class="solr.ASCIIFoldingFilterFactory"/>
        <filter class="solr.EdgeNGramFilterFactory" minGramSize="3" maxGramSize="15" />
        <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

Когда я удаляю «ASCIIFoldingFilterFactory», он работает. Та же проблема с «ISOLatin1AccentFilterFactory».

У кого-нибудь есть решение?

спасибо

1 Ответ

0 голосов
/ 27 декабря 2011

У меня была такая же проблема, и я сообщил об ошибке https://issues.apache.org/jira/browse/LUCENE-3642 - она ​​исправлена ​​в транке прямо сейчас.

Я применил патч вручную и скомпилировал solr самостоятельно, работал как для Solr 3.4, так и для Solr 3.5, хотя патч не был применен корректно, и мне пришлось сделать некоторые ручные исправления.

...