Wget: загрузка определенных файлов HTML - PullRequest
0 голосов
/ 02 октября 2018

Я безуспешно искал ответ, но до сих пор нарисовал пробел.Имеет ли Wget возможность загружать определенные html-файлы, используя «ключевое слово» из текста в теге Title html-файла?Я подумал, что, возможно, "--follow-tag" может это сделать, но тег Title не включен в базу данных тегов Wget.Да, я знаю, что могу отфильтровать файлы после загрузки, но не хотел использовать эту опцию.Спасибо

1 Ответ

0 голосов
/ 02 октября 2018

Вы можете попробовать что-то вроде этого:

wget -q `grep -oP '(?<=<url>).*?(?=</url>)' test.html`

Он будет искать любой URL-адрес внутри <url></url> тегов из test.html файла и загружать его.

...