FileUploadMiscError при сохранении выходного файла из пакета Azure - PullRequest
0 голосов
/ 10 января 2019

При попытке сохранить файлы журналов в хранилище BLOB-объектов Azure из пакетного выполнения Azure возникает следующая ошибка: «FileUploadMiscError. При загрузке одного из выходных файлов возникла другая ошибка». Эта ошибка не дает много информации о том, что может пойти не так. Я попытался проверить документацию Microsoft на наличие этого кода ошибки, но он не упоминает этот конкретный код ошибки. Ниже приведен соответствующий код для добавления задачи в пакет Azure, который я перенес из C # в Python для сохранения файлов журнала.

Примечание. Контейнер, который я настроил, создается при добавлении задачи, но внутри него нет больших двоичных объектов.

import datetime
import logging
import os

import azure.storage.blob.models as blob_model
import yaml
from azure.batch import models
from azure.storage.blob.baseblobservice import BaseBlobService
from azure.storage.common.cloudstorageaccount import CloudStorageAccount
from dotenv import load_dotenv

LOG = logging.getLogger(__name__)


def add_tasks(batch_client, job_id, task_id, io_details, blob_details):

    task_commands = "This is a placeholder. Actual code has an actual task. This gets completed successfully."

    LOG.info("Configuring the blob storage details")
    base_blob_service = BaseBlobService(
        account_name=blob_details['account_name'],
        account_key=blob_details['account_key'])
    LOG.info("Base blob service created")

    base_blob_service.create_container(
        container_name=blob_details['container_name'], fail_on_exist=False)
    LOG.info("Container present")

    container_sas = base_blob_service.generate_container_shared_access_signature(
        container_name=blob_details['container_name'],
        permission=blob_model.ContainerPermissions(write=True),
        expiry=datetime.datetime.now() + datetime.timedelta(days=1))
    LOG.info(f"Container SAS created: {container_sas}")

    container_url = base_blob_service.make_container_url(
        container_name=blob_details['container_name'], sas_token=container_sas)
    LOG.info(f"Container URL created: {container_url}")

    # fpath = task_id + '/output.txt'
    fpath = task_id

    LOG.info(f"Creating output file object:")
    out_files_list = list()

    out_files = models.OutputFile(
        file_pattern=r"../stderr.txt",
        destination=models.OutputFileDestination(
            container=models.OutputFileBlobContainerDestination(
                container_url=container_url, path=fpath)),
        upload_options=models.OutputFileUploadOptions(
            upload_condition=models.OutputFileUploadCondition.task_completion))

    out_files_list.append(out_files)
    LOG.info(f"Output files: {out_files_list}")

    LOG.info(f"Creating the task now: {task_id}")
    task = models.TaskAddParameter(
        id=task_id, command_line=task_commands, output_files=out_files_list)

    batch_client.task.add(job_id=job_id, task=task)
    LOG.info(f"Added task: {task_id}")

1 Ответ

0 голосов
/ 12 января 2019

В обработке пакета OutputFile имеется ошибка, из-за которой он не может загружаться в контейнеры, если полный URL-адрес контейнера включает в себя какие-либо параметры строки запроса, кроме тех, которые включены в маркер SAS. К сожалению, модуль azure-storage-blob Python включает дополнительный параметр строки запроса при генерации URL через make_container_url.

Эта проблема была только что поднята для нас, и в ближайшие недели будет выпущено исправление, но вместо использования make_container_url для создания URL-адреса проще простого: создайте его себе так: container_url = 'https://{}/{}?{}'.format(blob_service.primary_endpoint, blob_details['container_name'], container_sas).

Полученный URL должен выглядеть примерно так: https://<account>.blob.core.windows.net/<container>?se=2019-01-12T01%3A34%3A05Z&sp=w&sv=2018-03-28&sr=c&sig=<sig> - в частности, он не должен содержать restype=container (что входит в пакет azure-storage-blob)

...