Запрос ElasticSearch для заполнения или добавления значения в поле - PullRequest
0 голосов
/ 24 октября 2019

Наш индекс ElasticSearch содержит документы с полем с именем SourceId (никогда не пустым) и полем с именем CustomCategories. Поле CustomCategories может быть пустым или содержать от 1 до 10 разделенных запятыми 5-значных кодов.

Мне нужно добавить пользовательский код категории ABCDE во все документы, содержащие SourceIds 1,2,3,4,10,15,20,22.

Что такое запрос ElasticSearch, который я могу выполнить для этого, учитывая, что если поле CustomCategories пустое, мне просто нужно заполнить его ABCDE, тогда как если это поле НЕ пустое, Мне нужно добавить ,ABCDE в конец любого значения, которое есть?

РЕДАКТИРОВАТЬ 1 : для запроса от @jaspreet_chahal приведен пример документа, а также отображение дляcustomCategories поле:

Документ

 {
                "_index": "index123",
                "_type": "wls_doc",
                "_id": "JqkGxmYBwD-D6of2dr43",
                "_score": 1.0,
                "_source": {
                    "address": null,
                    "age": null,
                    "aliasList": null,
                    "caution": null,
                    "dateOfBirth": null,
                    "eyeColor": null,
                    "gender": null,
                    "hairColor": null,
                    "height": null,
                    "identifier": null,
                    "nationality": null,
                    "placeOfBirth": null,
                    "program": null,
                    "race": null,
                    "remarks": null,
                    "text": null,
                    "weight": null,
                    "entities": null,
                    "individualName": "John Doe",
                    "capturedDateTime": "2018-04-17T01:19:52.0131214",
                    "sourceId": 1,
                    "captureId": 194857,
                    "sourceAgencyAcronym": "ABC",
                    "sourceAgencyName": "Another Bad Creation",
                    "sourceCountry": "USA",
                    "sourceParentAgency": "Contoso",
                    "sourceRegion": "United States",
                    "url": "http://www.contoso.org",
                    "categories": [
                        "ABCDE",
                        "FGHIJ",
                        "KLMNO"
                    ],
                    "customCategories": [
                        "XA001",
                        "XB001"
                    ]
                }
            }

Отображение для поля customCategories:

                  "customCategories": {
                        "type": "text",
                        "fields": {
                            "keyword": {
                                "type": "keyword",
                                "ignore_above": 256
                            }
                        }
                    }

1 Ответ

2 голосов
/ 25 октября 2019

Вы можете использовать обновление по запросу

Данные:

[
      {
        "_index" : "index42",
        "_type" : "_doc",
        "_id" : "YqgIAW4BgXknAapksgky",
        "_score" : 1.0,
        "_source" : {
          "SourceId" : 1,
          "CustomCategories" : "abc"
        }
      },
      {
        "_index" : "index42",
        "_type" : "_doc",
        "_id" : "Y6gIAW4BgXknAapkxQl0",
        "_score" : 1.0,
        "_source" : {
          "SourceId" : 2,
          "CustomCategories" : ""
        }
      },
      {
        "_index" : "index42",
        "_type" : "_doc",
        "_id" : "ZKgIAW4BgXknAapk1wlV",
        "_score" : 1.0,
        "_source" : {
          "SourceId" : 3,
          "CustomCategories" : "abc"
        }
      }
    ]

Запрос:

POST index42/_update_by_query
{
  "script": {
    "source": "def categories=ctx._source.CustomCategories;if(categories ==''){ctx._source.CustomCategories='xyz'}else ctx._source.CustomCategories=categories+','+params.catg",
    "lang": "painless",
    "params":{"catg":"xyz"} ---> new value to be appended
  },
  "query": {
    "terms": {
      "SourceId": [1,2] --> source ids to be updated
    }
  }
}

Ответ:

 [
      {
        "_index" : "index42",
        "_type" : "_doc",
        "_id" : "ZKgIAW4BgXknAapk1wlV",
        "_score" : 1.0,
        "_source" : {
          "SourceId" : 3,
          "CustomCategories" : "abc"
        }
      },
      {
        "_index" : "index42",
        "_type" : "_doc",
        "_id" : "YqgIAW4BgXknAapksgky",
        "_score" : 1.0,
        "_source" : {
          "SourceId" : 1,
          "CustomCategories" : "abc,xyz" --> new value appened
        }
      },
      {
        "_index" : "index42",
        "_type" : "_doc",
        "_id" : "Y6gIAW4BgXknAapkxQl0",
        "_score" : 1.0,
        "_source" : {
          "SourceId" : 2,
          "CustomCategories" : "xyz" --> new value added
        }
      }
    ]

РЕДАКТИРОВАТЬ1:

POST index24/_update_by_query
{
  "script": {
    "source": "def categories=ctx._source.customCategories;if(categories ==null){ctx._source.customCategories= new ArrayList()}else ctx._source.customCategories.add(params.catg)",
    "lang": "painless",
    "params":{"catg":"xyz"}
  }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...