Лучший способ загрузить все артефакты, перечисленные в файле HTML5 cache.manifest? - PullRequest
7 голосов
/ 13 сентября 2011

Я пытаюсь посмотреть, как работает приложение HTML5, и любые попытки сохранить страницу в браузерах webkit (chrome, Safari) включают некоторые, но не все ресурсы cache.manifest. Есть ли библиотека или набор кода, который будет анализировать файл cache.manifest и загружать все ресурсы (изображения, сценарии, CSS)?

(исходный код перенесен в ответ ... ошибка noob>. <) </p>

1 Ответ

0 голосов
/ 22 декабря 2011

Первоначально я разместил это как часть вопроса ... (постер не стекается с новичком, НИКОГДА это не делает;)

, поскольку было полное отсутствие ответов.Вот, пожалуйста:

Я смог придумать следующий скрипт на Python, чтобы сделать это, но любой вклад был бы оценен =) (Это мой первый удар по коду Python, так что может быть лучше)

import os
import urllib2
import urllib

cmServerURL = 'http://<serverURL>:<port>/<path-to-cache.manifest>'

# download file code taken from stackoverflow
# /14385/kak-mne-zagruzit-fail-cherez-http-ispolzuya-python
def loadURL(url, dirToSave):
        file_name = url.split('/')[-1]
        u = urllib2.urlopen(url)
        f = open(dirToSave, 'wb')
        meta = u.info()
        file_size = int(meta.getheaders("Content-Length")[0])
        print "Downloading: %s Bytes: %s" % (file_name, file_size)

        file_size_dl = 0
        block_sz = 8192
        while True:
                buffer = u.read(block_sz)
                if not buffer:
                        break

                file_size_dl += len(buffer)
                f.write(buffer)
                status = r"%10d  [%3.2f%%]" % (file_size_dl, file_size_dl * 100. / file_size)
                status = status + chr(8)*(len(status)+1)
                print status,

        f.close()

# download the cache.manifest file
# since this request doesn't include the Conent-Length header we will use a different api =P
urllib.urlretrieve (cmServerURL+ 'cache.manifest', './cache.manifest')

# open the cache.manifest and go through line-by-line checking for the existance of files
f = open('cache.manifest', 'r')
for line in f:
        filepath = line.split('/')
        if len(filepath) > 1:
                fileName = line.strip()
                # if the file doesn't exist, lets download it
                if not os.path.exists(fileName):
                                print 'NOT FOUND: ' + line
                                dirName = os.path.dirname(fileName)
                                print 'checking dirctory: ' + dirName
                                if not os.path.exists(dirName):
                                        os.makedirs(dirName)
                                else:
                                        print 'directory exists'
                                print 'downloading file: ' + cmServerURL + line,
                                loadURL (cmServerURL+fileName, fileName)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...