Elasticsearch: распределение поля относительно другого поля - PullRequest
1 голос
/ 09 марта 2019

У меня есть эластичный поисковый БД с элементами вида

record = {
            'diagnosis': self.diagnosis,
            'vignette': self.vignette,
            'symptoms': self.symptoms_list,
            'care': self.care_level_string,
            'age': self.age,
            'gender': self.gender
        }

Мне нужен запрос, который возвращает распределение 'age' (с плавающей запятой), и еще один, который возвращает распределение 'gender' (строка с 2 параметрами) в отношении 'care' (строка с 3 параметрами).

Значение, например, если в БД было

1. care='a', age=1.0, gender='m'
2. care='b', age=2.0, gender='m'
3. care='c', age=1.0, gender='m'
4. care='a', age=1.0, gender='m'
5. care='b', age=2.0, gender='m'
6. care='c', age=3.0, gender='m'
7. care='a', age=3.0, gender='f'
8. care='b', age=3.0, gender='f'

тогда распределение gender относительно care='a' вернет что-то вроде

{'m:2, 'f':1}

Я не могу понять правильный синтаксис / понимание

Я использую Python

Спасибо!

1 Ответ

2 голосов
/ 09 марта 2019

Глядя на ваш вопрос, я пришел к приведенному ниже отображению, запросу и ответу.

Отображение

PUT medicalrecord
{
  "mappings": {
    "mydocs": {
      "properties": {
        "diagnosis": {
          "type": "text"
        },
        "vignette": {
          "type": "text"
        },
        "symptoms": {
          "type": "text"
        },
        "care": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword"
            }
          }
        },
        "age": {
          "type": "integer"
        },
        "gender":{
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword"
            }
          }
        }
      }
    }
  }
}

Обратите внимание, как я создал несколько полей для gender и care.Я бы посоветовал вам пройти по этой ссылке , чтобы вы узнали о ее актуальности.

Запрос

Ниже представлен запрос, который вы ищете.

Это комбинация простого фильтра с использованием Bool запроса на care с последующим объединением терминов над полем gender.

POST medicalrecord/_search
{
  "size": 0,
  "query": {
    "bool": {
      "filter": {
        "term": {
          "care.keyword": "a"
        }
      }
    }
  },
  "aggs": {
    "mf_distribution": {
      "terms": {
        "field": "gender.keyword"
      }
    }
  }
}

Обратите внимание, что я создал запрос для care со значением a.Вы можете построить аналогичные запросы для других его значений.

Глядя на ваш вопрос, я думаю, вы только начинаете с Elasticsearch.Я бы посоветовал вам потратить некоторое время на чтение о Агрегации .

Ниже показан ваш ответ на вышеуказанный запрос.

Ответ

{
  "took" : 10,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 3,
    "max_score" : 0.0,
    "hits" : [ ]
  },
  "aggregations" : {
    "mf_distribution" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "m",
          "doc_count" : 2
        },
        {
          "key" : "f",
          "doc_count" : 1
        }
      ]
    }
  }
}

То, что вы хотите, можно увидеть под buckets.

Надеюсь, это поможет!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...