GoogleCloudStorage Java API намного медленнее, чем gsuitl cp для больших файлов (20G) - PullRequest
1 голос
/ 06 февраля 2020

Перемещение файла 20G в корзину Google с использованием API-интерфейса java занимает более 40 минут. Прошло 4 минуты при использовании gsutil cp. Любая идея, где я могу пойти не так с java API хранилища?

Первая попытка с Java API.

    BlobInfo blobInfo = null;
    try (BufferedInputStream inputStream = new BufferedInputStream(new FileInputStream(fileToUpload))) {
        blobInfo =
            BlobInfo.newBuilder(bucketName, bucketFilePath)
                .setContentDisposition(String.format("attachment; filename=\"%s\"", bucketFilePath))
        try (WriteChannel writer = storage.writer(blobInfo, Storage.BlobWriteOption.md5Match())) {
            ByteStreams.copy(inputStream, Channels.newOutputStream(writer));
    } catch (StorageException ex) {
        if (!(400 == ex.getCode() && "invalid".equals(ex.getReason()))) {
            throw ex;

Вторая попытка с Java API

    BlobInfo blobInfo =
        BlobInfo.newBuilder(bucketName, bucketFilePath)
            .setContentDisposition(String.format("attachment; filename=\"%s\"", bucketFilePath))

    // Write the file to the bucket
    writeFileToBucket(storage, fileToUpload.toPath(), blobInfo);

private void writeFileToBucket(Storage storage, Path fileToUpload, BlobInfo blobInfo) throws Exception {
    // Code from :
    // examples/src/main/java/com/google/cloud/examples/storage/
    if (Files.size(fileToUpload) > 1_000_000) {
        // When content is not available or large (1MB or more) it is recommended
        // to write it in chunks via the blob's channel writer.
        try (WriteChannel writer = storage.writer(blobInfo)) {
          byte[] buffer = new byte[1024];
          try (InputStream input = Files.newInputStream(fileToUpload)) {
            int limit;
            while ((limit = >= 0) {
              try {
                writer.write(ByteBuffer.wrap(buffer, 0, limit));
              } catch (Exception ex) {
      } else {
        byte[] bytes = Files.readAllBytes(fileToUpload);
        // create the blob in one request.
        storage.create(blobInfo, bytes);

Обе Java попытки API заняли 40+ минут.

gsutil code

gcloud auth activ-service-account --key-file serviceAccountJsonKeyFile

gsutil cp fileToUpload gs: // google-bucket-name

1 Ответ

1 голос
/ 06 февраля 2020

GSutil имеет встроенную функцию для оптимизации загрузки большого файла, особенно путем его разделения и параллельной отправки нескольких частей для оптимизации пропускной способности.

Подробнее здесь

Подобные функции сложно реализовать.
