Как wget может сохранить только определенные типы файлов, на которые ссылаются страницы, на которые ссылается целевая страница, независимо от домена, в котором находятся определенные файлы?
Пытаясь ускорить задачу, которую мне приходится делать часто.
Я копался в документации по wget и гуглил, но, похоже, ничего не работает. Я продолжаю получать только целевую страницу или подстраницы без файлов (даже используя -H), поэтому я, очевидно, плохо справляюсь с этим.
Так, например, example.com/index1/ содержит ссылки на example.com/subpage1/ и example.com/subpage2/, тогда как на подстраницах содержатся ссылки на example2.com/file.ext и example2.com/file2. ext и т. д. Однако example.com/index1.html может ссылаться на example.com/index2/, в котором есть ссылки на дополнительные страницы, которые мне не нужны.
Может ли wget даже сделать это, а если нет, то что вы предлагаете мне использовать? Спасибо.