Используйте модуль urllib, чтобы загрузить в память zip-файл, который возвращает файлоподобный объект, который вы можете прочитать (), передать его в ZipFile (стандартный пакет).
Так как здесь есть несколько файлов, таких как ['test_data / AggregateData_Test.csv', 'test_data / TransactionData_Test.csv', 'train_data / AggregateData_Train.csv', 'train_data / Column_Description.xlsx', 'train_data / sample_submissioncs.csv', 'train_data_d_trl_Train_Train_Traction_Train_Traction_Train_Traction_Train_Rate.jpg)*
Загрузить его в поле данных с именем файла в качестве ключа.В целом код будет.
from urllib.request import urlopen
from zipfile import ZipFile
from io import BytesIO
zip_in_memory = urlopen("https://he-s3.s3.amazonaws.com/media/hackathon/hdfc-bank-ml-hiring-challenge/application-scorecard-for-customers/05d2b4ea-c-Dataset.zip").read()
z = ZipFile(BytesIO(zip_in_memory))
dict_of_dfs = {file.filename: pd.read_csv(z.open(file.filename))\
for file in z.infolist()\
if file.filename.endswith('.csv')}
Теперь вы можете получить доступ к фреймам данных каждого CSV, например dict_of_dfs['test_data/AggregateData_Test.csv']
.
. Конечно, все это не нужно, если вы просто скачаете ZIP-файл по ссылке.и передать его в виде почтового файла.