У меня есть задание mapreduce, где путь ввода файла: /basedirectory/*/*.txt
Внутри базового каталога у меня есть разные подпапки (CaseA, CaseB и т. Д.), Каждая из которых содержит текстовые файлы hdfs.
На этапе составления карты задания я хочу выяснить, откуда именно произошел фрагмент данных (например, CaseA). Как мне этого добиться?
Я сделал нечто подобное для заданий mapreduce с более чем 1 входной таблицей hbase, где я использую context.getInputSplit (). GetTableName (), чтобы найти фактическое имя таблицы, но не уверен, что делать с входными файлами HDFS.