Я пробовал различные утилиты в командной строке Ma c (curl
, wget
) и в R (rvest
, download
, RCurl
), чтобы получить эквивалент File > Save Page As ... > Webpage, Complete
дюйм Chrome. Все эти утилиты делают что-то , но ни одна из них не дает таких же результатов, как подход на основе меню в Chrome, который действительно захватывает всю необходимую мне информацию с веб-страницы. Мне нужно загрузить и проанализировать HTML для многих-многих веб-страниц.
Я не уверен, есть ли что-то особенное в веб-страницах, которые я пытаюсь загрузить, или я просто не работаю с правильными коммунальными услугами. Часто я получаю отказ в доступе.