Ну, первый предоставляет Tokenizer
, второй - Filter
; -)
Поскольку у вас может быть только один токенизатор, EdgeNGramTokenizerFactory полезен только для полей, содержащих одно слово.Если вы хотите разделить строку, которую вы предоставляете для своих документов, на слова, сначала вам понадобится другой токенизатор, который разделяется на пробелы или что-то еще, а затем EdgeNGramFilterFactory.