R - скачать сайт, включая все .css, .js, картинки и т. Д. - PullRequest
0 голосов
/ 22 ноября 2018

Скажите, что я хочу скачать страницу r-Bloggers.com.Если я нажму Ctrl + S в Chrome, будет загружен html-файл плюс папка с 58 файлами (.css, .js, Pictures и т. Д.)

Я бы хотел сделать то же самое с R.

Я нашел ответ и обернул его в system(): system("wget --page-requisites https://www.r-bloggers.com/")

не дает мне 58 + 1 файлов.

То же самое для:

download.file(url = "https://www.r-bloggers.com/", 
              destfile = "try", mode = "wget", extra = "--page-requisites")
download.file(url = "https://www.r-bloggers.com/", 
              destfile = "try.html", mode = "wget", extra = "--page-requisites")

1 Ответ

0 голосов
/ 25 ноября 2018

Это потому, что по умолчанию Wget будет пытаться загружать элементы только из одного домена.Однако этот веб-сайт загружает все с разных хостов.

Вам необходимо использовать флаг --span-hosts, чтобы разрешить Wget доступ к файлам с разных хостов

...