Как настроить Elasticsearch в распределенном режиме?
В настоящее время у меня есть,
- Spark 2.4 настроен для работы в кластере YARN
- Один главный и два рабочих узла
Как следуетЯ настраиваю упорядоченный поиск:
- На главном узле и заставляю его выступать в качестве центральной точки для всех рабочих узлов, резервное копирование данных в HDFS?
- Также на всех подчиненных узлах,где ES на главном узле будет настроен на использование ES подчиненных узлов?
Я крайне озадачен тем, как Elasticsearch будет индексировать / извлекать данные с использованием распределенной системы через Spark и Hadoop и чтолучшая архитектура была бы.
Может кто-нибудь помочь мне понять, как это будет работать?