Я работаю с использованием аннотаций поиска в спящем режиме, но есть также реализация Elasticsearch. Мой токенизатор не разделяется в соответствии с его конфигурациями. В частности, я ожидаю, что строка будет разделена минимум 3 символами. Но он игнорирует мою конфигурацию и продолжает делить как минимум на единицу. Что я делаю не так?
@AnalyzerDef(name = "EdgeNgram",
tokenizer = @TokenizerDef(factory = StandardTokenizerFactory.class),
filters = {
@TokenFilterDef(factory = StandardFilterFactory.class),
@TokenFilterDef(factory = LowerCaseFilterFactory.class),
@TokenFilterDef(factory = NGramFilterFactory.class,
params = {
@Parameter(name = "minGramSize", value = "3"),
@Parameter(name = "maxGramSize", value = "20")})
})