Поддерживает ли Elasticsearch токенизатор для токенизации терминов заглавными буквами, например: токенизация TheStarTech в термины [The, Star, Tech]. Pattern tokenizer кажется полезным, какие-либо предложения?
TheStarTech
[The, Star, Tech]
См. Это: World Token Filter
Он делает то, что вы хотите, и даже больше. Вы можете передать параметры, которые могут соответствовать вашим потребностям. Проверьте параметр split_on_case_change, который по умолчанию является истинным.
split_on_case_change