Question

Я использую потоковую передачу Spark для обработки больших объемов данных из очереди Kafka, и мне нужно записать результат в два настроенных кластера ES.

Я использую "org.elasticsearch.elasticsearch-spark- XX "в моем проекте и в состоянии записать в один кластер ES с помощью метода EsSpark.saveJsonToEs(), который внутренне выбирает свойства ES, специфицированные c, из неизменяемого контекста искры.

Итак, если контекст искры неизменен, как я можно изменять свойства во время выполнения и записывать результаты в несколько кластеров ES.

Пожалуйста, предложите.

Ref - https://www.elastic.co/guide/en/elasticsearch/hadoop/6.7/spark.html

Ram Ghadiyaram · Answer 1 · 09 января 2020

ИМХО следующий способ с spark.driver.allowMultipleContexts должен работать ... создать сеанс контекста спарка отдельно с новой конфигурацией спарка.

conf.set("es.index.auto.create", "true")
conf.set("es.nodes", "XXXXXXXX")
conf.set("es.port", "9020")
conf.set("spark.driver.allowMultipleContexts", "true")
val sc1 = new SparkContext(conf)

conf.set("es.index.auto.create", "true")
conf.set("es.nodes", "yyyyyy")
conf.set("es.port", "9020")
conf.set("spark.driver.allowMultipleContexts", "true")
val sc2 = new SparkContext(conf)

Запись в несколько приемников ES из Spark Streaming Job

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Запись в несколько приемников ES из Spark Streaming Job

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов