Я создаю скрипт для резервного копирования всей программы с несколькими папками, базами данных и сотнями папок и файлов.Для этого я использую этот код, и он прекрасно работает (слегка отредактирован для SO).
import tarfile
import datetime
PATH_PROGRAM = os.getcwd()
# Part 1: Get list of files
files_to_save = []
for file_name in listdir(PATH_PROGRAM):
if not file_name == "Backups Folder": # Exclude the folder where we store them
files_to_save.append(file_name)
# Part 2: Get name for new backup file
date_now = str(datetime.datetime.now())[:10]
backupfile = "{0}\\Backups Folder\\{1}.tar.gz".format(PATH_PROGRAM, date_now)
# Part 3: Add all files to new backup
with tarfile.open(backupfile, "w:gz") as tar:
for file in files_to_save:
print("Saving: {0}".format(file))
tar.add("{0}\\{1}".format(PATH_PROGRAM, file))
Проблема:
С этим кодом мои отпечатки просто показывают мне базовую папкувместо каждого файла, например:
Saving: File1.txt
Saving: File2.mp3
Saving: Folder_sounds
Saving: something.json
Давайте представим, что folder_sounds
- это папка с тысячами файлов.Сценарий займет много времени (замораживание моего графического интерфейса) при добавлении файлов этой папки в файл tar, но я не знаю, как это происходит, потому что в распечатке не отображаются все файлы по отдельности.В этом проблема.
То, что я пытался:
Я пытался получить полный путь к каждому файлу в части 1 моего кода, однако это добавило бы файлы вtarfile без создания папок внутри tarfile или добавления файлов в соответствующую папку.Это был беспорядок, потому что все файлы были в одном месте.
Желаемое решение:
1: Напечатайте каждое имя файла по мере его добавления в файл.
2: Сохраните все файлы в файле без прерываниядерево папок, к которому относится каждый файл.