ElasticSearch - нечеткие результаты поиска Java API не являются правильными - PullRequest
0 голосов
/ 05 октября 2018

Я проиндексировал образцы документов вasticsearch и пытаюсь выполнить поиск, используя нечеткий запрос.Но я не получаю никаких результатов при поиске с использованием API-интерфейса нечеткого запроса Java.

Пожалуйста, найдите нижеприведенный скрипт сопоставления:

PUT productcatalog
 {
    "settings": {
        "analysis": {
            "analyzer": {
                "attr_analyzer": {
                    "type": "custom",
                    "tokenizer": "letter",
                    "char_filter": [
                        "html_strip"
                    ],
                    "filter": ["lowercase", "asciifolding", "stemmer_minimal_english"]
                }
            },
            "filter" : {
                "stemmer_minimal_english" : {
                    "type" : "stemmer",
                    "name" : "minimal_english"
                }
            }
        }
    },
    "mappings": {
        "doc": {
            "properties": {
                "values": {
                    "type": "text",
                    "analyzer": "attr_analyzer"
                },
                "catalog_type": {
                    "type": "text"
                },
                "catalog_id":{
                    "type": "long"
                }
            }
        }
    }
}

Пожалуйста, найдите мои примеры данных.

PUT productcatalog/doc/1
{
    "catalog_id" : "343",
    "catalog_type" : "series",
    "values" : "Activa Rooftop, valves, VG3000, VG3000FS, butterfly, ball"
}


PUT productcatalog/doc/2
{
    "catalog_id" : "12717",
    "catalog_type" : "product",
    "values" : "Activa Rooftop, valves"
}

Пожалуйста, найдите мой поисковый скрипт:

GET productcatalog/_search
{
    "query": {
        "match" : {
            "values" : {
                "query" : " activa rooftop VG3000",
                "operator" : "and",
                 "boost": 1.0,
                "fuzziness": 2,
                "prefix_length": 0,
                "max_expansions": 100


            }
        }
    }
}

Получаю следующие результаты для вышеуказанного запроса:

{
  "took": 239,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 0.970927,
    "hits": [
      {
        "_index": "productcatalog",
        "_type": "doc",
        "_id": "1",
        "_score": 0.970927,
        "_source": {
          "catalog_id": "343",
          "catalog_type": "series",
          "values": "Activa Rooftop, valves, VG3000, VG3000FS, butterfly, ball"
        }
      }
    ]
  }
}

Но если я использую приведенный ниже Java API для того же нечеткого поиская не получаю никаких результатов.

Пожалуйста, найдите мой ниже API-запрос Java для нечеткого поиска:

QueryBuilder qb = QueryBuilders.boolQuery()
               .must(QueryBuilders.fuzzyQuery("values", keyword).boost(1.0f).prefixLength(0).maxExpansions(100));

Обновление 1

Iпробовал с приведенным ниже запросом

QueryBuilder qb = QueryBuilders.matchQuery(QueryBuilders.fuzzyQuery("values", keyword).boost(1.0f).prefixLength(0).maxExpansions(100));

Но я не могу передать QueryBuilders внутрь matchQuery.Получаю это предложение, когда пишу этот запрос The method matchQuery(String, Object) in the type QueryBuilders is not applicable for the arguments (FuzzyQueryBuilder)

1 Ответ

0 голосов
/ 06 октября 2018

Упомянутый Java-запрос не является запросом match.Это must запрос.Вы должны использовать matchQuery вместо boolQuery().must(QueryBuilders.fuzzyQuery())

Обновление 1 :

нечеткий запрос является запросом term в то время как запрос на сопоставление является запросом с полным текстом .

Также не забывайте, что в запросе на совпадение оператором по умолчанию является оператор or, который вы должны изменить на and, как ваш запрос DSL.

...