У меня есть данные, которые я хочу загрузить в HDFS.
папка с данными является многослойной, но самый внутренний каталог содержит только несколько файлов .gz.
папка сжата примерно на 250 ГБ, иЯ не знаю, сколько там файлов gz.
Я хочу загрузить это в HDFS, но они должны быть распакованы.
Есть ли способ, которым я могу добиться этого с помощью одного hadoop fs -put
команда?или пишет файл сценария, распаковывает его по одному и загружает в hdfs единственным способом?