Переиндексация копирует только четверть документов - PullRequest
0 голосов
/ 07 января 2019

Сначала я обновляю схему индекса, создавая новую версию индекса, затем скопировав текущий индекс в новый индекс.

PUT /users_v2
{}

POST /_reindex
{
  "source": {
    "index": "users_v1"
  },
  "dest": {
    "index": "users_v2"
  }
}

// ... then update aliases

Мой users_v1 индекс содержит ~ 2,5 млн документов. При переиндексации процесс останавливается на ~ 0,5м документов. Под останавливается Я не имею в виду, что http-запрос зависает, процесс переиндексации останавливается все вместе.

Новый индекс содержит новое поле ключевого слова (которое может существовать или не существовать в текущем индексе, поскольку разрешено динамическое обновление).

И существующее поле текста / ключевого слова - это не просто поле ключевого слова-

с-

    "f1": { 
      "type": "text",
      "fields": {
        "keyword": {
          "type": "keyword",
          "ignore_above": 256
        }
      }
    }

* 1016 To-*

      "fcm_subscription_id": { 
        "type": "keyword"
      }

Кроме этого, все остальное тоже самое.

Что может вызвать остановку процесса переиндексации или невозможность скопировать весь документ из существующего индекса?

Изменить:

Я попытался переиндексировать в ту же схему, чтобы исключить неверное изменение схемы. Повторное индексирование в той же схеме дает тот же результат.

...