Как исправить ошибку «Отказано в соединении» при запуске искрового задания в режиме кластера - PullRequest
0 голосов
/ 08 января 2019

Я использую тестирование terasort с искрой на кластере uni, который использует систему управления заданиями SLURM. Он отлично работает, когда я использую --master local [8], однако, когда я устанавливаю master в качестве текущего узла, я получаю сообщение об ошибке отказа в соединении.

Я запускаю эту команду для запуска приложения на локальном компьютере без проблем:

> spark-submit \
    --class com.github.ehiggs.spark.terasort.TeraGen \
    --master local[8] \
    target/spark-terasort-1.1-SNAPSHOT-jar-with-dependencies.jar 1g \
    data/terasort_in

Когда я использую режим кластера, я получаю следующую ошибку:

> spark-submit \
    --class com.github.ehiggs.spark.terasort.TeraGen \
    --master spark://iris-055:7077 \ #name of the cluster-node in use
    --deploy-mode cluster \
    --executor-memory 20G \
    --total-executor-cores 24 \
    target/spark-terasort-1.1-SNAPSHOT-jar-with-dependencies.jar 5g \
    data/terasort_in

Выход:

WARN  NativeCodeLoader:62 - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Exception in thread "main" org.apache.spark.SparkException:  Exception thrown in awaitResult: 
    at
org.apache.spark.util.ThreadUtils$.awaitResult(ThreadUtils.scala:226) 
    at 
.
.
./*many lines of timeout logs etc.*/
.
.
.
Caused by: java.net.ConnectException: Connection refused
... 11 more

Я ожидаю, что команда будет работать гладко и завершится, но я не могу преодолеть эту ошибку соединения.

1 Ответ

0 голосов
/ 09 января 2019

Возможно, проблема не в определении переменных --conf. Это может сработать:

spark-submit \
    --class com.github.ehiggs.spark.terasort.TeraGen \
    --master spark://iris-055:7077 \
    --conf spark.driver.memory=4g \
    --conf spark.executor.memory=20g \
    --executor-memory 20g \
    --total-executor-cores 24 \
    target/spark-terasort-1.1-SNAPSHOT-jar-with-dependencies.jar 5g \
    data/terasort_in
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...