Добавление папок в zip-файл с помощью python - PullRequest
42 голосов
/ 19 января 2009

Я хочу создать zip-файл. Добавьте папку в zip-файл, а затем добавьте в нее несколько файлов.

Итак, я хочу получить zip-файл с одной папкой с файлами.

Я не знаю, плохо ли иметь папки в zip-файлах или что-то в этом роде, но Google ничего мне не дает по этому вопросу.

Я начал с этого:

def addFolderToZip(myZipFile,folder):
    folder = folder.encode('ascii') #convert path to ascii for ZipFile Method
    for file in glob.glob(folder+"/*"):
            if os.path.isfile(file):
                print file
                myZipFile.write(file, os.path.basename(file), zipfile.ZIP_DEFLATED)
            elif os.path.isdir(file):
                addFolderToZip(myZipFile,file)

def createZipFile(filename,files,folders):
    curTime=strftime("__%Y_%m_%d", time.localtime())
    filename=filename+curTime;
    print filename
    zipFilename=utils.getFileName("files", filename+".zip")
    myZipFile = zipfile.ZipFile( zipFilename, "w" ) # Open the zip file for writing 
    for file in files:
        file = file.encode('ascii') #convert path to ascii for ZipFile Method
        if os.path.isfile(file):
            (filepath, filename) = os.path.split(file)
            myZipFile.write( file, filename, zipfile.ZIP_DEFLATED )

    for folder in  folders:   
        addFolderToZip(myZipFile,folder)  
    myZipFile.close()
    return (1,zipFilename)


(success,filename)=createZipFile(planName,files,folders);

Взято из: http://mail.python.org/pipermail/python-list/2006-August/396166.html

Который избавляется от всех папок и помещает все файлы в целевой папке (и ее подпапках) в один zip-файл. Мне не удалось добавить целую папку.

Если я передаю путь к папке в myZipFile.write, я получаю

IOError: [Errno 13] В доступе отказано: '.. \ pack \ bin'

Любая помощь приветствуется.

Смежный вопрос: Как мне сжать содержимое папки с помощью python (версия 2.5)?

Ответы [ 12 ]

51 голосов
/ 28 июня 2011

Вы также можете использовать шутил

import shutil

zip_name = 'path\to\zip_file'
directory_name = 'path\to\directory'

# Create 'path\to\zip_file.zip'
shutil.make_archive(zip_name, 'zip', directory_name)

Это поместит всю папку в zip.

45 голосов
/ 20 января 2009

Хорошо, после того как я понял, что вы хотите, это так же просто, как использовать второй аргумент zipfile.write, где вы можете использовать все, что вы хотите:

import zipfile
myZipFile = zipfile.ZipFile("zip.zip", "w" )
myZipFile.write("test.py", "dir\\test.py", zipfile.ZIP_DEFLATED )

создает zip-файл, где test.py будет извлечен в каталог с именем dir

EDIT: Однажды мне пришлось создать пустой каталог в zip-файле: это возможно. после кода выше просто удалите файл test.py из zipfile, файл исчезнет, ​​но пустой каталог останется.

14 голосов
/ 20 января 2009

Zip-файл не имеет структуры каталогов, он просто содержит несколько путей и их содержимое. Эти имена должны указываться относительно воображаемой корневой папки (сам ZIP-файл). Префиксы "../" не имеют определенного значения в zip-файле.

Предположим, у вас есть файл a, и вы хотите сохранить его в «папке» внутри zip-файла. Все, что вам нужно сделать, это префикс имени файла с именем папки при сохранении файла в zipfile:

zipi= zipfile.ZipInfo()
zipi.filename= "folder/a" # this is what you want
zipi.date_time= time.localtime(os.path.getmtime("a"))[:6]
zipi.compress_type= zipfile.ZIP_DEFLATED
filedata= open("a", "rb").read()

zipfile1.writestr(zipi, filedata) # zipfile1 is a zipfile.ZipFile instance

Я не знаю ни одной реализации ZIP, позволяющей включать пустую папку в ZIP-файл. Я могу придумать обходной путь (сохранение фиктивного имени файла в zip-папке ", который следует игнорировать при извлечении), но не переносимого в реализации.

8 голосов
/ 22 марта 2009
import zipfile
import os


class ZipUtilities:

    def toZip(self, file, filename):
        zip_file = zipfile.ZipFile(filename, 'w')
        if os.path.isfile(file):
                    zip_file.write(file)
            else:
                    self.addFolderToZip(zip_file, file)
        zip_file.close()

    def addFolderToZip(self, zip_file, folder): 
        for file in os.listdir(folder):
            full_path = os.path.join(folder, file)
            if os.path.isfile(full_path):
                print 'File added: ' + str(full_path)
                zip_file.write(full_path)
            elif os.path.isdir(full_path):
                print 'Entering folder: ' + str(full_path)
                self.addFolderToZip(zip_file, full_path)

def main():
    utilities = ZipUtilities()
    filename = 'TEMP.zip'
    directory = 'TEMP'
    utilities.toZip(directory, filename)

main()

Я бегу:

python tozip.py

Это журнал:

havok@fireshield:~$ python tozip.py

File added: TEMP/NARF (7ª copia)
Entering folder: TEMP/TEMP2
File added: TEMP/TEMP2/NERF (otra copia)
File added: TEMP/TEMP2/NERF (copia)
File added: TEMP/TEMP2/NARF
File added: TEMP/TEMP2/NARF (copia)
File added: TEMP/TEMP2/NARF (otra copia)
Entering folder: TEMP/TEMP2/TEMP3
File added: TEMP/TEMP2/TEMP3/DOCUMENTO DEL FINAL
File added: TEMP/TEMP2/TEMP3/DOCUMENTO DEL FINAL (copia)
File added: TEMP/TEMP2/NERF
File added: TEMP/NARF (copia) (otra copia)
File added: TEMP/NARF (copia) (copia)
File added: TEMP/NARF (6ª copia)
File added: TEMP/NERF (copia) (otra copia)
File added: TEMP/NERF (4ª copia)
File added: TEMP/NERF (otra copia)
File added: TEMP/NERF (3ª copia)
File added: TEMP/NERF (6ª copia)
File added: TEMP/NERF (copia)
File added: TEMP/NERF (5ª copia)
File added: TEMP/NARF (8ª copia)
File added: TEMP/NARF (3ª copia)
File added: TEMP/NARF (5ª copia)
File added: TEMP/NERF (copia) (3ª copia)
File added: TEMP/NARF
File added: TEMP/NERF (copia) (copia)
File added: TEMP/NERF (8ª copia)
File added: TEMP/NERF (7ª copia)
File added: TEMP/NARF (copia)
File added: TEMP/NARF (otra copia)
File added: TEMP/NARF (4ª copia)
File added: TEMP/NERF
File added: TEMP/NARF (copia) (3ª copia)

Как видите, все работает, архив тоже в порядке. Это рекурсивная функция, которая может архивировать всю папку. Единственная проблема заключается в том, что он не создает пустую папку.

Приветствие.

4 голосов
/ 27 апреля 2009

Ниже приведен код для архивирования всего каталога в zip-файл.

Кажется, это работает нормально, создавая zip-файлы в Windows и Linux. Выход файлы, кажется, извлекаются правильно в Windows (встроенная функция сжатых папок, WinZip и 7-Zip) и Linux. Однако в zip-файле появляются пустые каталоги быть сложной проблемой. Решение ниже, кажется, работает, но вывод "zipinfo" на linux касается. Также права доступа к каталогу не установлены правильно для пустых каталогов в zip-архиве. Это требует еще несколько углубленных исследований.

Я получил некоторую информацию от этой ветки отзывов о скорости и этой ветки списка рассылки python .

Обратите внимание, что эта функция предназначена для помещения файлов в zip-архив с либо нет родительского каталога или только один родительский каталог, поэтому он будет обрезать любой ведущие каталоги в путях файловой системы и не включать их в пути к zip-архивам. Это обычно тот случай, когда вы хотите просто взять каталог и превратить его в zip-файл, который можно распаковать в разные местах.

Аргументы ключевых слов:

dirPath - строковый путь к каталогу для архивирования. Это единственный обязательный аргумент. Может быть абсолютным или относительным, но только один или ноль ведущие каталоги будут включены в zip-архив.

zipFilePath - строковый путь к выходному zip-файлу. Это может быть абсолютным или относительный путь. Если zip-файл уже существует, он будет обновлен. Если нет, это будет создано. Если вы хотите заменить его с нуля, удалите его до вызова этой функции. (по умолчанию вычисляется как dirPath + ".zip")

includeDirInZip - логическое значение, указывающее, должен ли каталог верхнего уровня быть включены в архив или опущены. (по умолчанию True)

(Обратите внимание, что StackOverflow, похоже, не в состоянии распечатать мой питон с строки в тройных кавычках, поэтому я просто преобразовал свои строки документа в текст сообщения)

#!/usr/bin/python
import os
import zipfile

def zipdir(dirPath=None, zipFilePath=None, includeDirInZip=True):

    if not zipFilePath:
        zipFilePath = dirPath + ".zip"
    if not os.path.isdir(dirPath):
        raise OSError("dirPath argument must point to a directory. "
            "'%s' does not." % dirPath)
    parentDir, dirToZip = os.path.split(dirPath)
    #Little nested function to prepare the proper archive path
    def trimPath(path):
        archivePath = path.replace(parentDir, "", 1)
        if parentDir:
            archivePath = archivePath.replace(os.path.sep, "", 1)
        if not includeDirInZip:
            archivePath = archivePath.replace(dirToZip + os.path.sep, "", 1)
        return os.path.normcase(archivePath)

    outFile = zipfile.ZipFile(zipFilePath, "w",
        compression=zipfile.ZIP_DEFLATED)
    for (archiveDirPath, dirNames, fileNames) in os.walk(dirPath):
        for fileName in fileNames:
            filePath = os.path.join(archiveDirPath, fileName)
            outFile.write(filePath, trimPath(filePath))
        #Make sure we get empty directories as well
        if not fileNames and not dirNames:
            zipInfo = zipfile.ZipInfo(trimPath(archiveDirPath) + "/")
            #some web sites suggest doing
            #zipInfo.external_attr = 16
            #or
            #zipInfo.external_attr = 48
            #Here to allow for inserting an empty directory.  Still TBD/TODO.
            outFile.writestr(zipInfo, "")
    outFile.close()

Вот несколько примеров использования. Обратите внимание, что если ваш аргумент dirPath имеет несколько ведущих каталогов, по умолчанию будет включен только последний. Передайте includeDirInZip = False, чтобы пропустить все ведущие каталоги.

zipdir("foo") #Just give it a dir and get a .zip file
zipdir("foo", "foo2.zip") #Get a .zip file with a specific file name
zipdir("foo", "foo3nodir.zip", False) #Omit the top level directory
zipdir("../test1/foo", "foo4nopardirs.zip")
3 голосов
/ 09 октября 2009

вот моя функция, которую я использую, чтобы сжать папку:

import os
import os.path
import zipfile

def zip_dir(dirpath, zippath):
    fzip = zipfile.ZipFile(zippath, 'w', zipfile.ZIP_DEFLATED)
    basedir = os.path.dirname(dirpath) + '/' 
    for root, dirs, files in os.walk(dirpath):
        if os.path.basename(root)[0] == '.':
            continue #skip hidden directories        
        dirname = root.replace(basedir, '')
        for f in files:
            if f[-1] == '~' or (f[0] == '.' and f != '.htaccess'):
                #skip backup files and all hidden files except .htaccess
                continue
            fzip.write(root + '/' + f, dirname + '/' + f)
    fzip.close()
2 голосов
/ 18 августа 2013

Если вы посмотрите на zip-файл, созданный с помощью Info-ZIP, вы увидите, что каталоги действительно перечислены:

$ zip foo.zip -r foo
  adding: foo/ (stored 0%)
  adding: foo/foo.jpg (deflated 84%)
$ less foo.zip
  Archive:  foo.zip
 Length   Method    Size  Cmpr    Date    Time   CRC-32   Name
--------  ------  ------- ---- ---------- ----- --------  ----
       0  Stored        0   0% 2013-08-18 14:32 00000000  foo/
  476320  Defl:N    77941  84% 2013-08-18 14:31 55a52268  foo/foo.jpg
--------          -------  ---                            -------
  476320            77941  84%                            2 files

Обратите внимание, что запись каталога имеет нулевую длину и не сжимается. Похоже, вы можете добиться того же с Python, написав каталог по имени, но заставив его не использовать сжатие.

if os.path.isdir(name):
    zf.write(name, arcname=arcname, compress_type=zipfile.ZIP_STORED)
else:
    zf.write(name, arcname=arcname, compress_type=zipfile.ZIP_DEFLATED)

Возможно, стоит убедиться, что arcname заканчивается на /.

2 голосов
/ 19 января 2009

после добавления некоторых импортов ваш код работает нормально для меня, как вы называете скрипт, возможно, вы могли бы рассказать нам структуру папок в каталоге '.. \ pack \ bin'.

Я назвал ваш код со следующими аргументами:

planName='test.zip'
files=['z.py',]
folders=['c:\\temp']
(success,filename)=createZipFile(planName,files,folders)

`

0 голосов
/ 17 сентября 2014
import os
import zipfile

zf = zipfile.ZipFile("file.zip", "w")
for file in os.listdir(os.curdir):
    if not file.endswith('.zip') and os.path.isfile(os.curdir+'/'+file):
        print file
        zf.write(file)
    elif os.path.isdir(os.curdir+'/'+file):
        print f
        for f in os.listdir(os.curdir+'/'+file):
            zf.write(file+'\\'+f)
zf.close()
0 голосов
/ 15 декабря 2009

Большое спасибо за эту полезную функцию! Я нашел это очень полезным, поскольку я также искал помощь. Однако, возможно, было бы полезно немного изменить его, чтобы

basedir = os.path.dirname(dirpath) + '/'

будет

basedir = os.path.dirname(dirpath + '/')

Потому что обнаружил, что если я хочу заархивировать папку 'Example', которая находится в 'C: \ folder \ path \ notWanted \ to \ zip \ Example',

Я получил в Windows:

dirpath = 'C:\folder\path\notWanted\to\zip\Example'
basedir = 'C:\folder\path\notWanted\to\zip\Example/'
dirname = 'C:\folder\path\notWanted\to\zip\Example\Example\Subfolder_etc'

Но я полагаю, ваш код должен дать

dirpath = 'C:\folder\path\notWanted\to\zip\Example'
basedir = 'C:\folder\path\notWanted\to\zip\Example\'
dirname = '\Subfolder_etc'
...