0.0.0.0
- это имя хоста по умолчанию, а 8032 - номер порта по умолчанию.
Одной из причин, по которой вы получаете значения по умолчанию, является то, что ни одна из переменных среды Hadoop не установлена правильно. Ваша HADOOP_CONF_DIR
должна быть папкой Spark (или Hadoop) conf
, а не базовой папкой из извлечения Spark. Этот каталог должен содержать core-site.xml
, yarn-site.xml
, hdfs-site.xml
и hive-site.xml
при использовании HiveContext
Тогда, если yarn-site.xml находится в указанном выше месте, вам не нужно YARN_CONF_DIR
, но если вы его установите, это должен быть фактический каталог, а не файл.
Кроме того, вам, вероятно, потребуется указать более одного имени хоста. Например, кластер YARN производственного класса будет иметь два ResourceManager для отказоустойчивости. Кроме того, может быть, некоторые ключевые таблицы и принципалы Kerberos должны были бы быть установлены, если бы вы включили это.
Если у вас уже есть Mesos / Marathon, я не уверен, почему вы хотите использовать YARN