Текущая реализация клиента AWS-cloudsearch SDK, с которым я работаю, имеет отдельные задания для каждой операции (добавление документов, удаление документов, обновление схем анализа и т. Д.). В рамках работы по автоматизации развертываний я объединяю все эти задания и пытаюсь оптимизировать их. Из документации переиндексация для добавления и удаления документов происходит автоматически, но схемы анализа должны быть проиндексированы вручную .
Есть ли способ, которым я могу комбинировать операции, чтобы избежать следующего?
- повторная индексация одного и того же документа дважды (один раз при добавлении, а затем снова при обновлении всех схем анализа)
- каждый раз переиндексировать все документы - в идеале я бы переиндексировал только те документы, которые в нем нуждаются (будь то новые, недавно удаленные или имеющие новые или измененные синонимы)