Какие ключевые слова используются шведским анализатором? - PullRequest
0 голосов
/ 15 мая 2018

На этой части документов эластичного поиска сказано, что шведский анализатор может быть переопределён следующим образом:

PUT /swedish_example
{
  "settings": {
    "analysis": {
      "filter": {
        "swedish_stop": {
          "type":       "stop",
          "stopwords":  "_swedish_" 
        },
        "swedish_keywords": {
          "type":       "keyword_marker",
          "keywords":   ["exempel"] 
        },
        "swedish_stemmer": {
          "type":       "stemmer",
          "language":   "swedish"
        }
      },
      "analyzer": {
        "swedish": {
          "tokenizer":  "standard",
          "filter": [
            "lowercase",
            "swedish_stop",
            "swedish_keywords",
            "swedish_stemmer"
          ]
        }
      }
    }
  }

Мой вопрос: как этот анализатор распознает ключевые слова? Конечно, ключевые слова могут быть определены в поле settings.analysis.filter.swedish_keywords.keywords, но что, если мне лень это делать? Elasticsearch смотрит на список других ключевых слов предопределенных шведских ключевых слов? Потому что в приведенном выше примере, похоже, нет такого списка в настройках.

Другими словами, мне решать только ключевые слова или Elasticsearch просматривает какой-то другой список, чтобы найти ключевые слова по умолчанию?

1 Ответ

0 голосов
/ 16 мая 2018

Да, вам нужно указать этот список вами.В противном случае этот фильтр не будет делать ничего .

В соответствии с документацией Elasticsearch:

Маркер ключевого слова Фильтр маркеров

Защищает слова от модификации партерами.Должен быть помещен перед любыми фильтрами.

В качестве альтернативы вы можете указать:

keywords_path

Путь (относительно расположения конфигурации или абсолютный) к спискуслов.

keywords_pattern

Шаблон регулярного выражения для сопоставления со словами в тексте.

Подробнее об этом фильтре - https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-keyword-marker-tokenfilter.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...