Настройте кластер ElasticSearch через Hadoop + Spark - PullRequest
0 голосов
/ 05 марта 2019

Как настроить Elasticsearch в распределенном режиме?

В настоящее время у меня есть,

  • Spark 2.4 настроен для работы в кластере YARN
  • Один главный и два рабочих узла

Как следуетЯ настраиваю упорядоченный поиск:

  1. На главном узле и заставляю его выступать в качестве центральной точки для всех рабочих узлов, резервное копирование данных в HDFS?
  2. Также на всех подчиненных узлах,где ES на главном узле будет настроен на использование ES подчиненных узлов?

Я крайне озадачен тем, как Elasticsearch будет индексировать / извлекать данные с использованием распределенной системы через Spark и Hadoop и чтолучшая архитектура была бы.

Может кто-нибудь помочь мне понять, как это будет работать?

...