В контексте Amazon Elastic MapReduce (Amazon EMR) , вы ищете Действия начальной загрузки :
Действия начальной загрузки позволяют вам передатьссылка на скрипт, хранящийся в Amazon S3.Этот скрипт может содержать параметров конфигурации и аргументов, связанных с Hadoop или Elastic MapReduce .Действия начальной загрузки выполняются до запуска Hadoop и до того, как узел начинает обрабатывать данные. [выделение шахты]
Раздел Запуск пользовательских действий начальной загрузки из CLI предоставляет общий пример использования:
& ./elastic-mapreduce --create --stream --alive \
--input s3n://elasticmapreduce/samples/wordcount/input \
--mapper s3://elasticmapreduce/samples/wordcount/wordSplitter.py \
--output s3n://myawsbucket
--bootstrap-action s3://elasticmapreduce/bootstrap-actions/download.sh
В частностиСуществуют отдельные действия начальной загрузки для настройки Hadoop и Java:
Hadoop (кластер)
Вы можете указать настройки Hadoop с помощью действия начальной загрузки Настроить Hadoop , что позволяетнастроить параметры Hadoop для всего кластера , например:
$ ./elastic-mapreduce --create \
--bootstrap-action s3://elasticmapreduce/bootstrap-actions/configure-hadoop \
--args "--site-config-file,s3://myawsbucket/config.xml,-s,mapred.task.timeout=0"
Java (JVM)
Пользовательские параметры JVM можно указать с помощью действия начальной загрузки Настроить демонов :
Это предопределенное действие начальной загрузки позволяет указать размер кучи или другие параметры виртуальной машины Java (JVM) для демонов Hadoop.Это действие начальной загрузки можно использовать для настройки Hadoop для больших заданий, которые требуют больше памяти, чем Hadoop выделяет по умолчанию.Это действие начальной загрузки также можно использовать для изменения расширенных параметров JVM, таких как поведение сборки мусора.
Приведенный пример устанавливает размер кучи равным 2048 и настраивает параметр Java namenode :
$ ./elastic-mapreduce –create –alive \
--bootstrap-action s3://elasticmapreduce/bootstrap-actions/configure-daemons \
--args --namenode-heap-size=2048,--namenode-opts=-XX:GCTimeRatio=19