У меня есть несколько файлов в определенной папке в s3.Я хочу прочитать их все.В настоящее время я зацикливаю все файлы и создаю фрейм данных, используя pandas read_csv, а затем объединяю все эти файлы.Но этот процесс занимает много времени.Я хочу что-то, что может читать файлы и обрабатывать их.
текущий код:
s3 = boto3.resource("s3")
bg = s3.Bucket("bucket")
objects = bg.objects.filter(Prefix="prefix")
file_list = []
for obj in objects:
df = pd.read_csv(f's3://bucket/{obj.key}')
file_list.append(df)
final_df = pd.concat(file_list)
Существует большое количество файлов, которые мне нужно обработать.