Самый эффективный способ сделать это - использовать встроенный Экспорт BigQuery в механизм GCS, потому что BigQuery использует свой параллелизм для записи вывода с использованием нескольких потоков. Вы можете экспортировать до 1 ГБ табличных данных в один файл. Если вы экспортируете более 1 ГБ данных, используйте подстановочный знак , чтобы экспортировать данные в несколько файлов:
gs://<BUCKET_NAME>/csvfilename*.csv
Затем, когда все ваши файлы .csv
будут в хранилище. , вы можете использовать команду gsutil compose
, которая создает новый объект, содержимое которого представляет собой конкатенацию заданной последовательности исходных объектов в том же сегменте:
gsutil compose gs://<BUCKET_NAME>/a.csv gs://<BUCKET_NAME>/b.csv gs://<BUCKET_NAME>/composite.csv
, где composite.csv
- конкатенация a.csv
и b.csv
. Пожалуйста, обратитесь к документации .
Надеюсь, это поможет.