Я использую приведенный ниже код для извлечения .tgz
файлов. Типы файлов журналов (.tgz
), которые мне нужно извлечь, имеют подкаталоги, в которых есть другие .tgz
файлы и .tar
файлы. Я тоже хочу извлечь их.
В конечном итоге я пытаюсь найти определенные строки во всех .log
файлах и .txt
файлах, которые могут появляться в .tgz
файле.
Ниже приведен код, который я использую для извлечения файла .tgz
. Я пытался понять, как извлечь вложенные файлы (.tgz
и .tar
). До сих пор я был неудачным.
import os, sys, tarfile
try:
tar = tarfile.open(sys.argv[1] + '.tgz', 'r:gz')
for item in tar:
tar.extract(item)
print 'Done.'
except:
name = os.path.basename(sys.argv[0])
print name[:name.rfind('.')], '<filename>'