Нечеткий запрос не дает результатов - PullRequest
1 голос
/ 02 апреля 2020

Нечеткий запрос в elasti c Поиск не работает, даже с точным значением результаты пусты.

ES Версия: 7.6.2

Отображение индекса: Ниже приведены детали отображения

{
  "movies" : {
    "mappings" : {
      "properties" : {
        "genre" : {
          "type" : "text",
          "fields" : {
            "field" : {
              "type" : "keyword"
            }
          }
        },
        "id" : {
          "type" : "long"
        },
        "rating" : {
          "type" : "double"
        },
        "title" : {
          "type" : "text"
        }
      }
    }
  }
}

Документы: Нижеуказанные документы присутствуют в индексе

    {
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "movies",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : {
          "id" : 2,
          "title" : "Raju Ban gaya gentleman",
          "rating" : 2,
          "genre" : [
            "Drama"
          ]
        }
      },
      {
        "_index" : "movies",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 1.0,
        "_source" : {
          "id" : 2,
          "title" : "Baat ban jaegi gentleman",
          "rating" : 4,
          "genre" : [
            "Drama"
          ]
        }
      }
    ]
  }
}

Запрос: Ниже приведен запрос, который я использую для поиска в документе

GET movies/_search
{
  "query": {
    "fuzzy": {
      "title": {"value": "Bat ban jaegi gentleman", "fuzziness": 1}
    }
  }
}

Я раньше не использовал нечеткие запросы, и, насколько я понимаю, он должен работать просто отлично.

1 Ответ

1 голос
/ 02 апреля 2020

Нечеткие запросы не анализируются, но поле для поиска Bat ban jaegi gentleman будет разделено на разные термины, а Bat будет проанализировано, и этот термин будет в дальнейшем использоваться для фильтрации результатов.

Вы также можете обратиться к этому ответу Нечеткий запрос ElasticSearch о том, почему нечеткий запрос анализируется в поле.

Но так как вы хотите проанализировать полный заголовок, вы можете изменить отображение title также иметь поле keyword.

Вы можете увидеть, как именно ваша строка будет токенизирована с помощью API анализа: http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/indices-analyze.html

Ниже приведено отображение для то же самое:

"mappings": {
        "properties": {
            "genre": {
                "type": "text",
                "fields": {
                    "field": {
                        "type": "keyword"
                    }
                }
            },
            "id": {
                "type": "long"
            },
            "rating": {
                "type": "double"
            },
            "title": {
                "type": "text",
                "fields": {
                    "field": {
                        "type": "keyword"
                    }
                }
            }
        }
    }

Теперь, если вы будете искать в поле title.field, вы получите желаемый результат. Поисковый запрос:

    {
  "query": {
    "fuzzy": {
      "title.field": {"value": "Bat ban jaegi gentleman", "fuzziness": 1}
    }
  }
}

Результат, полученный в этом случае:

"hits": [
      {
        "_index": "ftestmovies",
        "_type": "_doc",
        "_id": "2",
        "_score": 0.9381845,
        "_source": {
          "title": "Baat ban jaegi gentleman",
          "rating": 4,
          "genre": [
            "Drama"
          ]
        }
      }
    ]
...