HADOOP_CONF_DIR
- это каталог с файлами конфигурации, которые библиотеки Hadoop используют для различных вещей, специфичных для Hadoop. Я написал различные специфичные для Hadoop вещи , чтобы подчеркнуть, что здесь не так много всего, связанного с Spark.
Что более важно, HADOOP_CONF_DIR
также может указывать на пустой каталог (который говорит, что он принимает значения по умолчанию).
Чтобы ответить на ваш вопрос, вы можете определить местоположение кластера в yarn-site.xml , используя yarn.resourcemanager.address
. Если yarn-site.xml
не найден, кластер YARN доступен на локальном хосте.
Где мне разместить yarn-site.xml
, чтобы spark-submit
использовал его?
Раньше я использовал YARN_CONF_DIR
, чтобы указывать на каталог с yarn-site.xml
.
YARN_CONF_DIR=/tmp ./bin/spark-shell --master yarn