Вы можете добавить два отдельных файла с помощью compose
в Google Cloud Shell и переименовать выходной файл в первый файл, например так:
gsutil compose gs://bucket/obj1 [gs://bucket/obj2 ...] gs://bucket/obj1
Эта команда предназначенадля параллельных загрузок, в которых вы делите большой объектный файл на более мелкие объекты.Они загружаются в Google Cloud Storage, а затем вы можете добавить их, чтобы получить исходный файл.Вы можете найти дополнительную информацию о составных объектах и параллельных загрузках.
Я предложил два возможных решения:
Решение облачной функции Google
Я бы выбрал вариант использования функции облака.Выполните что-то вроде следующего:
- Создайте пустую корзину, например append_bucket.
- Загрузите первый файл.
- Создайте облачную функцию, которая будет запущенановые загруженные файлы в корзине.
- Загрузите второй файл.
- Прочитайте первый и второй файл (вам нужно будет загрузить их как строку сначала).
- Выполните операцию добавления.
- Загрузите результат в корзину.
Решение Google Dataflow
Вы также можете сделать это с помощью Поток данных для BigQuery (имейте в виду, что он все еще находится в бета-версии).
- Создание набора данных и таблицы BigQuery.
- Создание экземпляра потока данных из шаблона CloudХранение текста в BigQuery.
- Создание файла Javascript с логикой для преобразования текста.
- Загрузка файлов в формате Json в корзину.
- Поток данных будет считывать Jsonфайл, выполнить код Javascript и добавить новые данные в BНабор данных igQuery.
- Наконец, экспортируйте результат запроса BigQuery в облачное хранилище.