Оптимизация индексации в облачном поиске при обновлении схем анализа - PullRequest
0 голосов
/ 23 апреля 2019

Текущая реализация клиента AWS-cloudsearch SDK, с которым я работаю, имеет отдельные задания для каждой операции (добавление документов, удаление документов, обновление схем анализа и т. Д.). В рамках работы по автоматизации развертываний я объединяю все эти задания и пытаюсь оптимизировать их. Из документации переиндексация для добавления и удаления документов происходит автоматически, но схемы анализа должны быть проиндексированы вручную .

Есть ли способ, которым я могу комбинировать операции, чтобы избежать следующего?

  • повторная индексация одного и того же документа дважды (один раз при добавлении, а затем снова при обновлении всех схем анализа)
  • каждый раз переиндексировать все документы - в идеале я бы переиндексировал только те документы, которые в нем нуждаются (будь то новые, недавно удаленные или имеющие новые или измененные синонимы)
...