Согласно «Hadoop: полное руководство»
Hadoop устанавливает параметры конфигурации задания в качестве переменных среды для потоковых программ.Однако он заменяет не алфавитно-цифровые символы подчеркиванием, чтобы убедиться, что они являются допустимыми именами.Следующее выражение Python иллюстрирует, как вы можете извлечь значение свойства mapred.job.id из скрипта Python Streaming:
os.environ ["mapred_job_id"]
Вы также можете установитьПеременные среды для процесса Streaming, запущенного MapReduce, с помощью параметра -cmdenv для программы запуска Streaming (один раз для каждой переменной, которую вы хотите установить).Например, следующее устанавливает переменную среды MAGIC_PARAMETER:
-cmdenv MAGIC_PARAMETER = abracadabra