У меня есть работа MR с несколькими входными файлами. Mapper num установлен около 3000. Я использую os.environ["map_input_file"]
, чтобы получить имя входного файла этой задачи карты.
Интересно:
- Изменится ли значение
os.environ["map_input_file"]
при выполнении задачи карты?
- Будет ли задача карты обрабатывать более одного файла? Например, если входными файлами являются A и B, будет ли карта обрабатывать часть файла A и часть файла B? Или он будет обрабатывать только часть одного файла?