папка tgz / zip, содержащая несколько файлов, распакованных в hdfs - PullRequest
0 голосов
/ 07 сентября 2018

Итак, у меня есть папка, которую я заархивировал и отправил в hdfs, мне нужно разархивировать эту папку внутри hdfs, сохранив все файлы, как они есть в папке.

Я могу запустить

hdfs dfs -cat /user/USERNAME/MYFOLDER/zipped_folder.tgz | zcat | hdfs dfs -put - /user/USERNAME/MYFOLDER/

Это выполняет распаковку данных, но помещает все данные в 1 '-' файл. Мне нужно, чтобы распакованные файлы были сохранены как есть, а не объединены в 1 файл.

Есть ли способ в hdfs сделать это? Я сделал копию папки как .zip и .tgz, если это что-то меняет.

Приветствия

P.S .: У меня нет доступа к локальному каталогу, папка уже в hdfs.

...