Токенайзер ngram ребра Elasticsearch возвращает менее значимые элементы - PullRequest
1 голос
/ 19 июня 2019

У меня есть краевой токенайзер Ngram, который делает токены следующим образом:

  1. x sport => xs sp spo spor sport
  2. sport active => s sp sp spor sport sport a ac act acti activ active
  3. xin xin sro => x xi xin x xi xin sr sro

Если я отправлю запрос на x sport , он создаст токены, как указано выше.Проблема заключается в том, что этот запрос включает в себя xin xin sro и не включает спортивные активные (в первых 20) предметы.Как это возможно, что Синь-Синь лучше соответствует спортивной фразе х, чем спортивному.Я действительно отсутствует.Пожалуйста помоги.Благодарю.

1 Ответ

0 голосов
/ 20 июня 2019

Проблема в неправильном анализаторе по времени поиска. В моем случае он должен быть стандартным, а не анализатором на основе реберной диаграммы из определения индекса. Вот объяснение https://www.elastic.co/guide/en/elasticsearch/guide/master/_index_time_search_as_you_type.html

...