Сортировка документов Elastic Search, проблема индексации - PullRequest
3 голосов
/ 08 марта 2012

У меня 9000 документов в моем индексе ElasticSearch.

Я хочу отсортировать по анализируемому строковому полю, поэтому для этого я знал (через Google), что должен обновить отображение, чтобы сделатьполе не проанализировано, поэтому я могу отсортировать по этому полю, и я должен заново проиндексировать данные, чтобы отразить изменение в отображении.

Процесс переиндексации занял около 20 минут на моей машине.

Странно то, что процесс переиндексации занимал около 2 часов на очень мощном производственном сервере.

Я проверил состояние памяти и загрузку процессора на этом сервере, и все было нормально.

Что я хочу знать, это:

  1. Есть ли способ сортировки документов по анализируемому токенизированному полю без повторной индексации целых документов?

  2. Если я должен переиндексировать целые документы, то почему для переиндексации документов на сервере требуется так много времени?или как отследить причину медлительности на этом сервере?

1 Ответ

0 голосов
/ 14 мая 2013

Пока поле хранится в _source, я уверен, что вы можете использовать скрипт для создания настраиваемых полей каждый раз, когда вы будете искать.сценарий сортировки на стороне сервера каждый раз, когда вы выполняете поиск, но я думаю, что он решает (1).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...