Я сейчас играю со сборщиком веб-страниц в Java, и мне любопытно, как лучше всего это сделать на Java.
У меня есть ссылка: например: http://www.nytimes.com/2010/07/08/technology/personaltech/08pogue.html?ref=technology
и когда я сканирую эту страницу, я могу найти пути img src, такие как
"../public/images/header.jpg" "../../test/logo.gif"
, где он может быть относительно одного из подкаталогов, в которых находится файл
Вопрос в том, что ...в Java есть библиотека, которая могла бы превратить их в абсолютные пути, такие как
http://www.nytimes.com/2010/07/08/technology/public/images/header.jpg
?
спасибо
Класс URL должен быть в состоянии сделать это, см .: http://download.oracle.com/docs/cd/E17409_01/javase/6/docs/api/java/net/URL.html#URL%28java.net.URL,%20java.lang.String%29
Например:
URL pageURL = new URL("http://www.nytimes.com/2010/07/08/technology/personaltech/08pogue.html?ref=technology"); URL imageURL = new URL(pageURL, "../public/images/header.jpg");
Предупреждение: не проверялось это