wget посещение URL, который имеет родительский каталог точно после имени хоста - PullRequest
0 голосов
/ 08 сентября 2011

Обновление: я обновил wget с 1.10 до 1.12 и решил проблему.

Например

www.example.com / level1 / level2 /../ test.html

Таким образом, wget и браузер посетят

www.example.com / level1 / test.html

Но для

www.example.com /../ test.html

wget посетит

www.example.com /../ test.html

браузер посетит

www.example.com / test.html

Я использовал wget для анализа какой-либо веб-страницы, чтобы узнать ее размер и элементы внутри. Теперь я обнаружил, что некоторые веб-страницы используют «../css/xxx.jpg» вместо «css / xxx.jpg». Это нормально, чтобы посетить веб-страницу с браузером, но не Wget.

Есть ли способ решить это? Спасибо.

1 Ответ

0 голосов
/ 08 сентября 2011

Перед передачей URL-адресов в wget обрежьте "../" с начала пути. (разделение URL-адресов на компоненты поможет.)

Как это сделать, зависит от того, какой язык или рамки вы используете.

...