Как загрузить большой файл в GCP Cloud Storage? - PullRequest
0 голосов
/ 05 декабря 2018

У меня есть файл данных размером 3 ГБ для загрузки в GCP Cloud Storage.Я попытался с примером в учебнике GCP Загрузка объектов.Но когда я пытаюсь загрузить файл, у меня появляется следующая ошибка:

java.lang.OutOfMemoryError: Required array size too large

Я попытался сделать следующее:

BlobId blobId = BlobId.of(gcpBucketName, "ft/"+file.getName());
BlobInfo blobInfo = BlobInfo.newBuilder(blobId).setContentType("text/plain").build();
Blob blob = storage.get().create(blobInfo, Files.readAllBytes(Paths.get(file.getAbsolutePath())));
return blob.exists();

Как я могу это исправить?Есть ли возможный способ загрузки больших файлов с помощью Java-клиента GCP Cloud для хранения?

Ответы [ 2 ]

0 голосов
/ 01 апреля 2019

Версия хранилища:

  <artifactId>google-cloud-storage</artifactId>
  <version>1.63.0</version>

Подготовка:

            BlobId blobId = BlobId.of(BUCKET_NAME, date.format(BASIC_ISO_DATE) + "/" + prefix + "/" + file.getName());
            BlobInfo blobInfo = BlobInfo.newBuilder(blobId).setContentType("application/gzip").build();
            uploadToStorage(storage, file, blobInfo);

Основной метод:

private void uploadToStorage(Storage storage, File uploadFrom, BlobInfo blobInfo) throws IOException {
    // For small files:
    if (uploadFrom.length() < 1_000_000) {
        byte[] bytes = Files.readAllBytes(uploadFrom.toPath());
        storage.create(blobInfo, bytes);
        return;
    }

    // For big files:
    // When content is not available or large (1MB or more) it is recommended to write it in chunks via the blob's channel writer.
    try (WriteChannel writer = storage.writer(blobInfo)) {

        byte[] buffer = new byte[10_240];
        try (InputStream input = Files.newInputStream(uploadFrom.toPath())) {
            int limit;
            while ((limit = input.read(buffer)) >= 0) {
                writer.write(ByteBuffer.wrap(buffer, 0, limit));
            }
        }

    }
}
0 голосов
/ 05 декабря 2018

Это происходит потому, что массив, возвращаемый Files.readAllBytes , имеет размер больший, чем максимально допустимый .

Обходное решение, которое вы можете сделать, эторазделите файл на несколько массивов байтов, загрузите их как отдельные файлы в корзину и соедините их с помощью команды gsutil compose .

...