Мне нужно взять URL в виде HTML вместе с сопровождающими изображениями.HTML должен быть сохранен с пользовательским именем файла (я даю ему метку времени в вызывающем скрипте), и изображения должны иметь эти метки времени.
Результирующая папка должна быть структурирована следующим образом:
2012-02-22 06:00:00 UTC.html
2012-02-22 07:00:00 UTC.html
2012-02-22 08:00:00 UTC.html
img1_2012-02-22 06:00:00 UTC.gif
img2_2012-02-22 06:00:00 UTC.gif
img1_2012-02-22 07:00:00 UTC.gif
img2_2012-02-22 07:00:00 UTC.gif
img1_2012-02-22 08:00:00 UTC.gif
img2_2012-02-22 08:00:00 UTC.gif
По сути, это зеркало, которое должно переписывать пути изображений для локального относительного пути в html.Я поигрался с --directory-prefix
и --output-document
в wget без особого успеха, так как он встраивает изображения в выходной файл html.
Это выполнимо с помощью wget или лучше написать свойсценарий, чтобы просто вытянуть каждый файл вниз, а затем проанализировать HTML-файл, заменяя строки соответственно?