Что означает ключевое слово «Снежок» в поиске Elastic? - PullRequest
5 голосов
/ 23 февраля 2012

Когда я использую эластичный поиск, я сначала обращаюсь к нему.В этом процессе я слепо использую колонку "SNOWBALL" , "KEYWORD" n анализатора.Каково основное использование Analyzer (я знаю, что это усилитель), но он помогает мне в упругом поиске n Что означает ключевое слово «Снежок»?

'data.description': {'analyzer': 'snowball', 'type': 'string'},
'data.title': {'analyzer': 'snowball', 'type': 'string'}

Ответы [ 2 ]

9 голосов
/ 25 февраля 2012

Анализаторы - это процесс, который извлекает индексируемые термины из текста, предоставленного для индексации.

Например

В тексте «я - динозавр современности». Когда это анализируется с помощью анализатора «стоп-слов», в индексе хранятся только ключевые слова современных и возрастных категорий. Это означает, что если вы ищете «am», хотя слово присутствует в индексируемом вами тексте, оно не будет указывать на этот проиндексированный документ.

Аналогично снежный ком представляет собой комбинацию стоп-слово , строчные буквы и стандартного анализатора - https://www.elastic.co/guide/en/elasticsearch/reference/2.4/analysis-snowball-analyzer.html

3 голосов
/ 24 ноября 2016

Фильтр снежного кома используется для определения слов, основанных на определенном словаре.Стеммер использует некоторые правила, чтобы определить правильную основу слова.Это означает, что разные обработчики могут возвращать разные результаты.

Например, слова «индексация», «индексируемые», «индексы», «индексация» и т. Д. Будут обозначены как «индекс».Особенно интересно получить документ с заголовком «Сделать мою строку индексируемой» при поиске «Индексирование строки». (c)

Для настройки этого фильтра см. https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-snowball-tokenfilter.html

PS http://snowball.tartarus.org/ |http://snowballstem.org/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...