сохранить веб-страницу с urllib - PullRequest
0 голосов
/ 15 марта 2011
import urllib
url='www.something.com/something..'
f = urllib.urlretrieve(url,'copy.html') 

этот код создает только HTML-файл, который предоставляет прямую ссылку на указанный URL-адрес (т. Е. Он недоступен в автономном режиме). Как сохранить веб-страницу, чтобы она была доступна в автономном режиме .??

1 Ответ

2 голосов
/ 15 марта 2011

Вам нужно получить все остальные ресурсы, на которые указывает страница (CSS-файлы, изображения ...).

Я предлагаю вам использовать "wget", он уже делает то, что вы хотите.

...