У меня есть zip-архив с дополнительными вложенными zip-архивами, мне нужно распаковать родительский zip-архив в облачном потоке данных Google с помощью apache beam apk и сохранить полученные файлы в облачном хранилище google.
Это для входного файла переменного размера, размер которого может варьироваться от 1 до 100 ГБ. и поток данных Google выглядит как многообещающий кандидат на работу.
expected input:
-MyFiles.zip
-MyNestedFiles-folder(1)
-MyMoreNestedFiles.zip
-Other_non_zips
-MyNestedFiles-folder(n)
-MyMoreNestedFiles.zip
-Other_non_zips
-Other_non_zips
expected output:
-MyNestedFiles-folder(1)
-MyMoreNestedFiles.zip
-Other_non_zips
-MyNestedFiles-folder(n)
-MyMoreNestedFiles.zip
-Other_non_zips
-Other_non_zips