Как я могу использовать соответствие запроса И вместо запятой? - PullRequest
0 голосов
/ 04 августа 2020

У меня есть 3 столбца «почему, цель, оценка, аналогично». Это своего рода рекомендательная система. цель - "A Hotel", аналогично "B Hotel, C Hotel", почему причина. если в столбце «почему» указано «Анталия, Кум Плай», мой результат ДОЛЖЕН включать «Анталия, Кум Плай» вместе, как «Анталия И Кум Плай», когда вы посмотрите на картинку ниже, вы увидите, что «Анталия, Кум Плай» работает как «Antalya OR Kum Plaj».

Я попробовал 2 запроса, но оба они не работают должным образом.

Мой первый запрос:

    {
  "query": {
    "bool": {
      "must": [
        {
          "range": {
            "rate": {
              "gte": 0.7,
              "lte": 1,
              "boost": 2.0
            }
          }
        },
        {
          "term": {
            "target.keyword": "Robinson Club Nobilis"
          }
        },
        {
          "match": {
            "why": "Antalya,Kum Plaj"
          }
        }
      ]
    }
    
  }
}

Второй запрос:

    POST /hotelsimilaritydeneme*/_search
{
   "query":{
      "multi_match" : {
         "query": "(Kum Plaj AND Antalya) and Not why.keyword : '' and target.keyword :'Design Plus Seya Beach'  and rate >= 0.6",
         "fields": [ "why","target","rate"]
      }
   }
}

Я не сбиваю с толку, но результат должен включать "Kum plaj, Antalya". Но в некоторых результатах есть только сумма "kum plaj", результат "Antalya", конечно, есть еще одна особенность отеля. Но «Кум Плай, Анталия» должен работать «Кум Плай И Анталия», а не «Кум Плай или Анталия»

Это мое отображение:

{
  "mapping": {
    "object": {
      "properties": {
        "rate": {
          "type": "float"
        },
        "similarTo": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "target": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        },
        "why": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword",
              "ignore_above": 256
            }
          }
        }
      }
    }
  }
}

Мои данные образца:

{
  "took": 98,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 17,
    "max_score": 10.760553,
    "hits": [
      {
        "_index": "hotelsimilarity-2020",
        "_type": "object",
        "_id": "nuy9cnMBwlYcZ3X2cH4o",
        "_score": 10.760553,
        "_source": {
          "target": "Robinson Club Nobilis",
          "similarTo": "Crystal Waterworld Resort & Spa",
          "rate": 0.75,
          "why": "Diyet Büfesi,Kum Plaj,Antalya"
        }
      },
      {
        "_index": "hotelsimilarity-2020",
        "_type": "object",
        "_id": "yuy9cnMBwlYcZ3X2cH4o",
        "_score": 10.760553,
        "_source": {
          "target": "Robinson Club Nobilis",
          "similarTo": "Crystal Sunset Luxury Resort & Spa",
          "rate": 0.75,
          "why": "Diyet Büfesi,Kum Plaj,Antalya"
        }
      }]
      }
}

1 Ответ

2 голосов
/ 05 августа 2020

Работает согласно отображению. Потому что text использует анализатор standard. Следовательно, ваши условия будут обозначены как

{
    "tokens": [
        {
            "token": "kum",
            "start_offset": 0,
            "end_offset": 3,
            "type": "<ALPHANUM>",
            "position": 0
        },
        {
            "token": "plaj",
            "start_offset": 4,
            "end_offset": 8,
            "type": "<ALPHANUM>",
            "position": 1
        },
        {
            "token": "antalya",
            "start_offset": 9,
            "end_offset": 16,
            "type": "<ALPHANUM>",
            "position": 2
        }
    ]
}

Таким образом, только Antalya документы являются частью результатов.

Чтобы этого избежать, вам необходимо изменить сопоставление.

Я предлагаю вам использовать разделенные запятыми patternTokenizer вместе со стандартным фильтром

Для достижения с тем же сопоставлением:

{
  "query":{
    "query_string":{
      "fields":["why"],
      "query": "Kum Plaj, Antalya",
      "default_operator":"and"
    }
  }
}

Документы - вывод:

"hits": [
      {
        "_index": "similar",
        "_type": "_doc",
        "_id": "aafzvXMBoP4Sw8kfTdzk",
        "_score": 0.7161402,
        "_source": {
          "target": "Robinson Club Nobilis",
          "similarTo": "Crystal Waterworld Resort & Spa",
          "rate": 0.75,
          "why": "Diyet Büfesi,Kum Plaj,Antalya"
        }
      },
      {
        "_index": "similar",
        "_type": "_doc",
        "_id": "aqfzvXMBoP4Sw8kfctxi",
        "_score": 0.7161402,
        "_source": {
          "target": "Robinson Club Nobilis",
          "similarTo": "Crystal Sunset Luxury Resort & Spa",
          "rate": 0.75,
          "why": "Diyet Büfesi,Kum Plaj,Antalya"
        }
      }
    ]

Входные документы:

"hits": [
      {
        "_index": "similar",
        "_type": "_doc",
        "_id": "aafzvXMBoP4Sw8kfTdzk",
        "_score": 1.0,
        "_source": {
          "target": "Robinson Club Nobilis",
          "similarTo": "Crystal Waterworld Resort & Spa",
          "rate": 0.75,
          "why": "Diyet Büfesi,Kum Plaj,Antalya"
        }
      },
      {
        "_index": "similar",
        "_type": "_doc",
        "_id": "aqfzvXMBoP4Sw8kfctxi",
        "_score": 1.0,
        "_source": {
          "target": "Robinson Club Nobilis",
          "similarTo": "Crystal Sunset Luxury Resort & Spa",
          "rate": 0.75,
          "why": "Diyet Büfesi,Kum Plaj,Antalya"
        }
      },
      {
        "_index": "similar",
        "_type": "_doc",
        "_id": "a6f1vXMBoP4Sw8kfrNyB",
        "_score": 1.0,
        "_source": {
          "target": "Robinson Club Nobilis",
          "similarTo": "Crystal Sunset Luxury Resort & Spa",
          "rate": 0.75,
          "why": "Diyet Büfesi,Kum Plaj"
        }
      }
    ]
...