Solr Tokenizer для инъекций - PullRequest
       20

Solr Tokenizer для инъекций

5 голосов
/ 25 августа 2011

В качестве примера у меня есть текстовое поле, которое может содержать следующую строку:

"d7199 ^^ == ^^ 81 ^^ == ^^ Предложение или два !!"

Я хочу маркировать эти данные, но каждый токен должен содержать первую часть строки. Итак, я бы хотел, чтобы токены выглядели так для примера выше:

"d7199 ^^ == ^^ 81 ^^ == ^^ символ"

"d7199 ^^ == ^^ 81 ^^ == ^^ предложение"

"d7199 ^^ == ^^ 81 ^^ == ^^ или"

"d7199 ^^ == ^^ 81 ^^ == ^^ два"

Как бы я поступил так?

1 Ответ

1 голос
/ 31 августа 2011

Вы можете реализовать свой собственный Tokenizer и добавить его в путь к классам Solr. Затем используйте его в вашем Solr schema.xml и solrconfig.xml

...