Вы можете попробовать:
wget --user-agent=Mozilla --content-disposition --mirror --convert-links -E -K -p http://example.com/
Также вы можете добавить:
-A pdf,ps,djvu,tex,doc,docx,xls,xlsx,gz,ppt,mp4,avi,zip,rar
, чтобы принять определенные расширения или отклонить только определенные расширения:
-R html,htm,asp,php
или для исключения определенных областей:
-X "search*,forum*"
Если файлы игнорируются для роботов (например, поисковых систем), вы должны добавить также: -e robots=off