В чем разница между EdgeNGramTokenizerFactory EdgeNGramFilterFactory в SOLR? - PullRequest
2 голосов
/ 18 июня 2010

В чем разница между этими двумя фильтрами? Они, кажется, имеют одинаковый эффект?

Кто-нибудь может привести пример их применения к какому-либо тексту?

1 Ответ

6 голосов
/ 24 июля 2010

Ну, первый предоставляет Tokenizer, второй - Filter; -)

Поскольку у вас может быть только один токенизатор, EdgeNGramTokenizerFactory полезен только для полей, содержащих одно слово.Если вы хотите разделить строку, которую вы предоставляете для своих документов, на слова, сначала вам понадобится другой токенизатор, который разделяется на пробелы или что-то еще, а затем EdgeNGramFilterFactory.

...