Я хочу найти общее количество студентов, у которых есть файлы в папке s3. У меня есть структура каталогов как:
s3://bucket/student=10/year=2019/month=05/...
Предположим, что дата - год = 2019, месяц = 06, тогда я хочу найти общее число студентов с файлами, присутствующими в папке с указанными датами.
Я использую boto3 в Python.
s3 = boto3.resource("s3")
ob = s3.Bucket("bucket")
dic = {}
dic["total students"] = []
for n in range(5):
date = end_date - timedelta(days=n)
date = date.strftime(f'year=%Y/month=%m/')
for obj in ob.objects.filter(Prefix=f'/student_id={student_id}/{date}'):
.....
if student_id not in dic["total students"]:
dic["total students"+student_id].append(student_id)
Однако я думаю, что это не очень хороший подход. Есть ли способ подсчитать количество студентов напрямую