У меня есть структура HDFS что-то вроде
a/b/file1.gz
a/b/file2.gz
a/c/file3.gz
a/c/file4.gz
Я использую классический шаблон
FileInputFormat.addInputPaths(conf, args[0]);
, чтобы установить мой путь ввода для задания сокращения Java-карты.
Это прекрасно работает, если я укажу args [0] как a / b , но произойдет сбой, если я укажу только a (мое намерениеобработать все 4 файла)
ошибка
Exception in thread "main" java.io.IOException: Not a file: hdfs://host:9000/user/hadoop/a
Как мне рекурсивно добавить все в a ?
Я должен что-то упуститьпросто ...