Elasticseach или запрос значений через запятую - PullRequest
0 голосов
/ 02 января 2019

Я сохраняю идентификаторы в базе данных как разделенные запятыми и индексирую их в ElasticSearch.Теперь мне нужно узнать, совпадает ли user_id со значением.

Например, оно сохраняет это в индексации для столбца user_ids (тип базы данных varchar (500) вasticsearch это текст)

8938,8936,8937

$userId = 8936; // For example expecting to return that row
$whereCondition = [];
$whereCondition[]  = [
                "query_string" => [
                    "query"=> $userId,
                    "default_field" => "user_ids",
                    "default_operator" => "OR"
                ]
            ];

$searchParams = [
    'query' => [
        'bool' => [
            'must' => [
                $whereCondition
            ],
            'must_not' => [
                ['exists' => ['field' => 'deleted_at']]
            ]
        ]
    ],
    "size" => 10000
];

User::search($searchParams);

Json Query

{
    "query": {
        "bool": {
            "must": [
                [{
                    "query_string": {
                        "query": 8936,
                        "default_field": "user_ids",
                        "default_operator": "OR"
                    }
                }]
            ],
            "must_not": [
                [{
                    "exists": {
                        "field": "deleted_at"
                    }
                }]
            ]
        }
    },
    "size": 10000
}

Подробности отображения

{
    "user_details_index": {
        "aliases": {},
        "mappings": {
            "test_type": {
                "properties": {
                    "created_at": {
                        "type": "date",
                        "format": "yyyy-MM-dd HH:mm:ss"
                    },
                    "deleted_at": {
                        "type": "date",
                        "format": "yyyy-MM-dd HH:mm:ss"
                    },
                    "updated_at": {
                        "type": "date",
                        "format": "yyyy-MM-dd HH:mm:ss"
                    },
                    "user_ids": {
                        "type": "text",
                        "fields": {
                            "keyword": {
                                "type": "keyword",
                                "ignore_above": 256
                            }
                        }
                    }
                }
            }
        },
        "settings": {
            "index": {
                "creation_date": "1546404165500",
                "number_of_shards": "5",
                "number_of_replicas": "1",
                "uuid": "krpph26NTv2ykt6xE05klQ",
                "version": {
                    "created": "6020299"
                },
                "provided_name": "user_details_index"
            }
        }
    }
}

Я пытаюсь использовать вышеуказанную логику, но не могуизвлечения.Может ли кто-нибудь помочь в этом.

1 Ответ

0 голосов
/ 02 января 2019

Поскольку поле user_ids относится к типу text, для него по умолчанию не указан анализатор, поэтому будет использоваться анализатор standard, который не будет разбивать 8938,8936,8937 на термины 8938, 8936 и 8937 и, следовательно, идентификатор не может совпадать.

Чтобы решить эту проблему, я бы предложил вам сохранить массив идентификаторов в поле user_ids вместо csv. Таким образом, при индексации ввод json должен выглядеть следующим образом:

{
   ...

   "user_ids": [
      8938,
      8936,
      8937
   ]

   ...
}

Поскольку идентификаторы пользователя являются целочисленными значениями, в преобразовании должны быть сделаны следующие изменения:

{
   "user_ids": {
      "type": "integer"
   }
}

Запрос теперь будет выглядеть следующим образом:

{
  "query": {
    "bool": {
      "filter": [
        [
          {
            "terms": {
              "userIds": [
                8936
              ]
            }
          }
        ]
      ],
      "must_not": [
        [
          {
            "exists": {
              "field": "deleted_at"
            }
          }
        ]
      ]
    }
  },
  "size": 10000
}
...