Question

У меня есть индекс ElasticSearch, который в настоящее время использует токенайзер ICU с шириной cjk. Я могу успешно искать японские термины. У клиента есть такие термины, как DR cases или в случаях букв алфавита в середине японского языка. Пример: 100 々のデバイス（HW１等）の構成およ変更更 100

В настоящее время я не могу найти DR 計画 или HW1. Как правильно настроить индекс для этого?

Я пробовал токенизатор kuromoji и ngram min 2, max 20.

Как индексировать смешанный алфавитно-цифровой и японский в ElasticSearch

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как индексировать смешанный алфавитно-цифровой и японский в ElasticSearch

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы