Как индексировать смешанный алфавитно-цифровой и японский в ElasticSearch - PullRequest
0 голосов
/ 22 октября 2019

У меня есть индекс ElasticSearch, который в настоящее время использует токенайзер ICU с шириной cjk. Я могу успешно искать японские термины. У клиента есть такие термины, как DR cases или в случаях букв алфавита в середине японского языка. Пример: 100 々 の デ バ イ ス (HW1 等) の 構成 お よ 変 更 更 100

В настоящее время я не могу найти DR 計画 или HW1. Как правильно настроить индекс для этого?

Я пробовал токенизатор kuromoji и ngram min 2, max 20.

...