ElasticSearch ищет дефисный текст с пробелами вместо тире в запросе - PullRequest
0 голосов
/ 06 февраля 2019

Я проиндексировал данные (person) с firstName = "Jean-Marc", и я хотел бы найти этого человека, используя комбинацию различных запросов, например для firstName "Jean-Marc" это должно бытьможно искать с помощью: «Жан-Марк» и «Жан-Марк» (с пробелами или тире)

Вот отображение:

  "firstName": {
    "type": "keyword",
    "normalizer": "keyword_normalizer",
    "fields": {
      "analysed": {
        "type": "text",
        "analyzer": "hyphen_analyzer",
        "search_analyzer": "standard",
        "fielddata": true
      }
    }
  }

И настройка:

"char_filter": {
    "allowOnlyChar": {
        "pattern": "[^A-Za-z]",
        "type": "pattern_replace",
        "replacement": " "
    }
}

"analyzer": {
    "hyphen_analyzers": {
        "filter": "lowercase",
        "char_filter": [
            "allowOnlyChar"
        ],
        "type": "custom",
        "tokenizer": "standard"
    }
}

Я получаю человека, когда держу черту, но без результата с запросом пробела

Я использую эластичный 6.2.4

1 Ответ

0 голосов
/ 06 февраля 2019

Определите свой анализатор:

"char_filter": {
    "allowOnlyChar": {
        "pattern": "[^A-Za-z]",
        "type": "pattern_replace",
        "replacement": " "
    }
}

"analyzer": {
    "yourAnalyzer": {
        "filter": "lowercase",
        "char_filter": [
            "allowOnlyChar"
        ],
        "type": "custom",
        "tokenizer": "standard"
    }
}

И, конечно, индексируйте ваши документы с помощью этого анализатора."analyzer": "yourAnalyzer"

ссылка на документ: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-replace-charfilter.html

...