проблемы с использованием lucene подсветки и полноты. - PullRequest
2 голосов
/ 16 декабря 2011

Теперь я сталкиваюсь с проблемой.Ниже приведен контент для индекса, который я написал 100

was written for a formula, it's written as this, indeed.[latxt]$$ \left( {a + b} \right)\left( {{1 \over a} + {1 \over b}} \right) \ge \left( {a \cdot {1 \over a} + b \cdot {1 \over b}} \right)^2  = 4 $$[/latxt] was written for a formula, it's written as this, indeed.

Когда я ищу 1 \ over b, использую SimpleFragmenter для подсветки, чтобы контролировать длину содержимого подсветки.Результатом являются только части кодов.

   {1 \over a} + b \cdot {<em>1 \over b</em>}} \right)^2

Но что я действительно хочу, так это все содержимое меток [latxt], а затем скомпилируйте его в изображение.

Методы, которые я рассматриваю ниже:

  • Если есть метки [latxt], не используйте маркер, а просто скомпилируйте его в изображение, затем в соответствии со смещением термина ,получить несколько периодов.Но этот метод недостаточно точен.
  • Чтобы реализовать Fragmenter самостоятельно, полностью обработайте контент, где есть отметки [latxt], так как я до сих пор не могу освоить Fragmenter, возможно, этот метод вряд ли подойдет.

Итак, я искренне надеюсь, что вы можете показать мне некоторые другие способы, которые могут быть более удобными и простыми для выполнения.

1 Ответ

0 голосов
/ 07 января 2012

Вам нужно будет использовать TermVectors с позицией и смещением. Этот пост объясняет, как.

...