Я пытаюсь найти все теги изображений на определенной странице.Пример страницы может быть www.chapitre.com
Я использую следующий код для поиска всех изображений на странице:
HtmlPage page = HTMLParser.parseHtml(webResponse, webClient.openWindow(null,"testwindow"));
List<?> imageList = page.getByXPath("//img");
ListIterator li = imageList.listIterator();
while (li.hasNext() ) {
HtmlImage image = (HtmlImage)li.next();
URL url = new URL(image.getSrcAttribute());
//For now, only load 1X1 pixels
if (image.getHeightAttribute().equals("1") && image.getWidthAttribute().equals("1")) {
System.out.println("This is an image: " + url + " from page " + webRequest.getUrl() );
}
}
Это не 'Верните мне все теги изображений на странице.Например, тег изображения с атрибутами "src =" http://ace -lb.advertising.com / site = 703223 / mnum = 1516 / bins = 1 / rich = 0 / logs = 0 / betr = A2099 = [+] LP2"width =" 1 "height =" 1 "" должно быть захвачено, но это не так.Я что-то здесь не так делаю?
Любая помощь очень ценится.
Ура!