Что такое веб-сайт в этом случае?
Локальный виртуальный каталог?
Статическая веб-страница?
Динамические страницы где-то размещены?
Посмотрите на
wget --mirror
У Curl тоже могут быть опции.
Также, пожалуйста, прочитайте о robots.txt
, прежде чем вы начнете очищать сеть:)