Проблема:
Предположим, я пишу 20 небольших PDF-файлов в формате zip, тогда размер zip составляет около 400 МБ, тогда как общий размер этих 20 файлов составляет всего 4 МБ. После открытия созданного zip-файла осталось только 20 файлов, но когда я выполняю операцию восстановления этого zip-файла, в файлы, которые я заархивировал, появляется много дубликатов pdf, я понятия не имею, почему. Файлы хранятся в s3, а zip также создается в s3, когда я делаю все локально, все работает нормально. Follwoing - фрагмент кода, который я использую
with process_obj.archive_file.storage.open(process_obj.archive_file.name, 'wb') as archive_file:
# Create a zip archive
with zipfile.ZipFile(archive_file, mode='w', compression=zipfile.ZIP_DEFATED) as zip_file:
# Write excel file in zip
process_obj.excel_file.save(download_excel_util.get_excel_filename(), temp_workbook)
zip_file.writestr(
download_excel_util.get_excel_filename(),
process_obj.excel_file.read()
)
process_obj.added_file_count += 1
process_obj.save()
for file in files:
zip_file.writestr(u'{}{}'.format(u'Profiles/', u'{}.pdf'.format(resume.get_file_name())), file.read())
# Update `added_file_count` in process object
process_obj.added_file_count += 1
process_obj.save()