Elasticsearch - токенизируйте термины заглавными буквами, например, «TheStarTech» => [The, Star, Tech] - PullRequest
0 голосов
/ 04 ноября 2019

Поддерживает ли Elasticsearch токенизатор для токенизации терминов заглавными буквами, например: токенизация TheStarTech в термины [The, Star, Tech]. Pattern tokenizer кажется полезным, какие-либо предложения?

1 Ответ

1 голос
/ 05 ноября 2019

См. Это: World Token Filter

Он делает то, что вы хотите, и даже больше. Вы можете передать параметры, которые могут соответствовать вашим потребностям. Проверьте параметр split_on_case_change, который по умолчанию является истинным.

...