полный веб-сайт "wget" на основе фреймов - PullRequest
4 голосов
/ 11 декабря 2010

У меня маленькая проблема. Я хочу рекурсивно загрузить эту веб-страницу , но она основана на "фреймах". Стандартные методы не могут мне помочь. Я пробую разные варианты, но ничего. Максимум, что я могу скачать одну рекурсию, я нашел пример там . Как я могу получить этот веб-сайт полностью, и чем использовать его в автономном режиме? Thx.

Ответы [ 3 ]

1 голос
/ 20 декабря 2010

Если вы хотите локальную копию сайта, используйте - зеркало :

wget --mirror http://www.example.com/

Некоторые другие опции также полезны:

--convert-links преобразует абсолютные ссылки в локальные ссылки, поэтому вы можете просматривать сайт локально.

- HTML-расширение добавляет .html к любым ресурсам, которые не имеютсуффикс (это полезно для просмотра очень динамичных сайтов локально через apache)

-p получает изображения, CSS и все ресурсы, необходимые для загрузки страницы

Так:

wget --mirror --convert-links --HTML-extension -p http://www.example.com/

Наконец, если это не ваш сайт, будьте вежливы и добавьте -w (ожидание между запросами, в секундах)

1 голос
/ 28 июня 2011

Попробуйте это:

 wget -E -H -k -K -p "http://yoursite.com/path"

Работает для моего варианта использования (для загрузки ссылочных кадров HTML)

0 голосов
/ 20 декабря 2010

Что вы используете для команд? Вы на MSWindows? Например. "wget ​​--mirror –w 2 –p --HTML-расширение –-convert-links –P c: \ wget_files \ example1 http://base.safework.ru/iloenc"

...