С помощью следующего кода я могу правильно извлечь изображение:
Document doc = Jsoup.parse("<div class=\"picture\"> <img src=\"http://asdasd/aacb.jpgs\" title=\"picture\" alt=\"picture\" /> </div>");
Element elem = doc.select("div.picture img").first();
System.out.println("elem: " + elem.attr("src"));
Я использую версию jsoup 1.2.2 , последнюю версию.
Возможно, вы пытаетесь напечатать внутренний HTML-код пустого тега, например img.
Из документации: «html () - извлекает внутренний HTML-код элемента».
Для второй части HTML вы можете использовать:
Document doc2 = Jsoup.parse("<tr> <td class=\"blackNoLine\" nowrap=\"nowrap\" valign=\"top\" width=\"25\" align=\"left\"><b>CAST: </b></td> <td class=\"blackNoLine\" valign=\"top\" width=\"416\">Jay, Shazahn Padamsee </td> </tr>");
Elements trElems = doc2.select("tr");
if (trElems != null) {
for (Element element : trElems) {
Element secondTd = element.select("td").get(1);
System.out.println("name: " + secondTd.text());
}
}
с надписью "Jay, Shazahn Padamsee".