Попытка извлечь только определенный файл из tar-файла HDFS - PullRequest
0 голосов
/ 10 декабря 2018

У меня есть сценарий, в котором у нас есть огромный tar-файл в HDFS, из которого нужно извлечь только конкретный файл.

с использованием tar в hadoop fs, как показано ниже, не работает

hadoop fs -tar -tvf <tar file path> | other operations.
hadoop fs -tar -xvf <tarfile path> -C <path for extract> <filename>

В то время как я натолкнулся на хорошую статью https://passingthoughts.quora.com/Making-Hadoop-work-on-TAR-files, но у меня нет доступа к core-site.xml для внесения изменений в вышеуказанную статью.Я ищу альтернативный способ поиска и копирования файлов из tar HDFS.Пожалуйста, дайте мне знать, если у кого-то есть решение этой проблемы.

...