По сути, я хочу пройтись по корзине и использовать структуру папок, чтобы классифицировать каждый файл по дате его выполнения (год).
Итак, у меня есть корзина s3, путь которой выглядит следующим образом:
file/archive/run=2017-10-07-06-13-21/folder_paths/version=1-0-0/part-00000-b.txt
file/archive/run=2018-11-07-06-13-21/folder_paths/version=1-0-0/part-00000-c.txt
В папке архива есть даты выполнения.
В конечном счете, я хочу иметь возможность перебирать файлы и писать part-000 .... txt файлы в CSV-файл по дате (год). Поэтому я хочу, чтобы все файлы .txt, которые выполняются, были в 2018 году в одном файле CSV, все файлы .txt в 2017 году и все файлы .txt в 2019 году.
Я новичок в boto3 и s3, поэтому я Я очень запутался в том, как go сделать это:
Вот мой код:
#Import boto3 module
import boto3
import logging
from botocore.exceptions import ClientError
#This is to List existing Buckets for the AWS account
PREFIX = 'shredded/'
#Create a session to your AWS account
s3client = boto3.client(
's3',
aws_access_key_id=ACCESS_KEY,
aws_secret_access_key=SECRET_KEY,
region_name=REGION_NAME,
)
bucket = 'mybucket'
startAfter = '2020-00-00-00-00-00'
s3objects= s3client.list_objects_v2(Bucket=bucket, StartAfter=startAfter )
for object in s3objects['Contents']:
print(object['Key'])
Любые предложения или идеи помогут.