wget рекурсивно отражает сайт, включая внешние ресурсы, но не отражает внешние html файлы - PullRequest
0 голосов
/ 03 августа 2020

Итак, я хочу загрузить сайт для работы в автономном режиме с помощью wget без предварительного определения уровня глубины рекурсии. Я хочу, чтобы wget рекурсивно просматривал все файлы html, принадлежащие моему сайту, и зеркально отображал их, включая внешние ресурсы, которые не принадлежат моему сайту (изображения, видео шрифты все, кроме файлов html). Однако я не хотите, чтобы он рекурсивно просматривал страницы html или загружал внешние страницы с внешнего хоста.

Я пробовал wget -E -H -k -p $siteURL, который дает мне все на странице, но не рекурсивно просматривает другие html файлы на моем сайте. С другой стороны, wget -r -k -p -E дает мне все файлы html на моем сайте, но не внешние ресурсы. wget -E -r -H -k -p дает мне весь inte rnet.

Что-нибудь из wget, что может мне в этом помочь? Заранее спасибо!

...