Не удается установить тип содержимого Azure Файл озера данных - PullRequest
0 голосов
/ 29 февраля 2020

Мне нужно загрузить файлы CSV в Azure Data Lake Gen2 файловую систему. Я просто сошел с ума, пытаясь установить тип содержимого Azure File Lake File при его создании. Пожалуйста, смотрите код ниже:

from azure.storage.filedatalake import DataLakeServiceClient, ContentSettings

def upload_file_to_directory(category, type, startdatetime, enddatetime, content):
    try:

        service_client = get_service_client()

        file_system_client = service_client.get_file_system_client(file_system="tag-data")

        category_directory_client = file_system_client.get_directory_client(category)

        type_directory_client = category_directory_client.get_sub_directory_client(type)

        year_directory_client = type_directory_client.get_sub_directory_client(startdatetime.strftime("%Y"))

        month_directory_client = year_directory_client.get_sub_directory_client(startdatetime.strftime("%m"))

        day_directory_client = month_directory_client.get_sub_directory_client(startdatetime.strftime("%d"))

        metadata = {"uploadedby": "Casper Alant"}
        content_settings = ContentSettings(content_type = "text/csv")
        file_name = startdatetime.strftime("%Y%m%d%H%M%S") + "-" + enddatetime.strftime("%Y%m%d%H%M%S") + ".csv"

        file_client = day_directory_client.get_file_client(file_name)

        file_client.create_file(content_settings=content_settings, metadata=metadata)

        file_client.append_data(data=content, offset=0, length=len(content))

        file_client.flush_data(len(content))

    except Exception as e:
      print(e)

Файл создан с содержимым, метаданные «uploadedby» установлены правильно, но я не могу получить его для установки Типа содержимого.

Я следовал официальной документации здесь . Я не могу найти много ресурсов по использованию этого SDK.

1 Ответ

1 голос
/ 02 марта 2020

Если вы используете azure -storage-file-datalake 12.0.0b7 , вы можете установить content-type в методе flush_data.

#your other code

content_settings = ContentSettings(content_type = "text/csv")

file_client.flush_data(len(content),content_settings=content_settings)
...