В запросеasticsearch все время проводят в create_weight - PullRequest
0 голосов
/ 19 января 2019

У меня есть два кластера эластичного поиска с одинаковыми индексами и данными по каждому кластеру.Тот же самый простой запрос занимает миллисекунды в кластере A, но в кластере B он занимает более 10 секунд.

Я использовал _profileAPI, а в кластере B я вижу, чтоasticsearch тратит огромное время на операцию create_weight.

  {
    "id" : "[dj3LJZL1RNuPEP7S0ZXFVQ][index_2018_12][3]",
    "searches" : [
      {
        "query" : [
          {
            "type" : "TermQuery",
            "description" : "n:8096344531",
            "time" : "441.2ms",
            "time_in_nanos" : 441271696,
            "breakdown" : {
              "score" : 0,
              "build_scorer_count" : 20,
              "match_count" : 0,
              "create_weight" : 441255457,
              "next_doc" : 0,
              "match" : 0,
              "create_weight_count" : 1,
              "next_doc_count" : 0,
              "score_count" : 0,
              "build_scorer" : 16218,
              "advance" : 0,
              "advance_count" : 0
            }
          }
        ],
        "rewrite_time" : 3967,
        "collector" : [
          {
            "name" : "CancellableCollector",
            "reason" : "search_cancelled",
            "time" : "79.4micros",
            "time_in_nanos" : 79420,
            "children" : [
              {
                "name" : "SimpleTopScoreDocCollector",
                "reason" : "search_top_hits",
                "time" : "42.1micros",
                "time_in_nanos" : 42166
              }
            ]
          }
        ]
      }
    ],
    "aggregations" : [ ]
  },
  {
    "id" : "[dj3LJZL1RNuPEP7S0ZXFVQ][index_2018_12][4]",
    "searches" : [
      {
        "query" : [
          {
            "type" : "TermQuery",
            "description" : "n:8096344531",
            "time" : "296.7ms",
            "time_in_nanos" : 296795143,
            "breakdown" : {
              "score" : 0,
              "build_scorer_count" : 15,
              "match_count" : 0,
              "create_weight" : 296779276,
              "next_doc" : 0,
              "match" : 0,
              "create_weight_count" : 1,
              "next_doc_count" : 0,
              "score_count" : 0,
              "build_scorer" : 15851,
              "advance" : 0,
              "advance_count" : 0
            }
          }
        ],
        "rewrite_time" : 2947,
        "collector" : [
          {
            "name" : "CancellableCollector",
            "reason" : "search_cancelled",
            "time" : "54.7micros",
            "time_in_nanos" : 54776,
            "children" : [
              {
                "name" : "SimpleTopScoreDocCollector",
                "reason" : "search_top_hits",
                "time" : "18.6micros",
                "time_in_nanos" : 18642
              }
            ]
          }
        ]
      }
    ],
    "aggregations" : [ ]
  },
  {
    "id" : "[dj3LJZL1RNuPEP7S0ZXFVQ][index_2019_01][3]",
    "searches" : [
      {
        "query" : [
          {
            "type" : "TermQuery",
            "description" : "n:8096344531",
            "time" : "173.2ms",
            "time_in_nanos" : 173260750,
            "breakdown" : {
              "score" : 0,
              "build_scorer_count" : 17,
              "match_count" : 0,
              "create_weight" : 173247380,
              "next_doc" : 0,
              "match" : 0,
              "create_weight_count" : 1,
              "next_doc_count" : 0,
              "score_count" : 0,
              "build_scorer" : 13352,
              "advance" : 0,
              "advance_count" : 0
            }
          }
        ],
        "rewrite_time" : 4606,
        "collector" : [
          {
            "name" : "CancellableCollector",
            "reason" : "search_cancelled",
            "time" : "47.5micros",
            "time_in_nanos" : 47584,
            "children" : [
              {
                "name" : "SimpleTopScoreDocCollector",
                "reason" : "search_top_hits",
                "time" : "15.8micros",
                "time_in_nanos" : 15809
              }
            ]
          }
        ]
      }
    ],
    "aggregations" : [ ]
  },
  ...

В кластере B TermQuery занимает от 100 мс до 500 мс на каждом шарде, тогда как в кластере A требуется всего несколько микросекунд *

Что я могу сделать, чтобы это исправить?

1 Ответ

0 голосов
/ 19 января 2019

Я решил свою собственную проблему, поэтому выкладываю ее здесь!

Фактически индексы кластера B были созданы путем восстановления моментального снимка индексов кластера A (поэтому я добавляю точно такие же данные в каждом кластере),Я думаю, что именно поэтому индексы были сегментированы.

Чтобы решить проблему медлительности, мне пришлось выполнить Forcemerge для каждого индекса:

POST /index_*/_forcemerge?max_num_segments=1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...