Обработка китайских символов в MarkLogic - PullRequest
0 голосов
/ 28 января 2019

Я пытаюсь найти документ, который содержит китайские иероглифы.Включены индексы: поиск по слову, поиск по 3 символам, быстрый поиск по фразе.Перед повторной индексацией код дает правильные результаты, но после повторной индексации он не дает ожидаемого результата.

XML:

<root>
  <name xml:lang="en">Propylene</name>
  <name xml:lang="zh">丙烯</name>
</root>

Поисковый запрос:

cts:search(collection('live'),
  cts:element-query(xs:QName('name'), 
    cts:word-query('丙烯', ("wildcarded", "whitespace-insensitive", "lang=zh"), 1)))

Я ожидаюприведенный выше XML-код в наборе результатов, но его нет в наборе результатов после повторной индексации.

Отличается ли индексирование для других языков, кроме "Английский" в MarkLogic?

1 Ответ

0 голосов
/ 29 января 2019
...