Зачем использовать HTML-модуль, если вы можете попробовать мой новый пакет HTML Scrape?
Сюда входит документация и файл JAR, а также производится очистка данных с веб-сайтов для: переводов иностранных новостей, финансовых данных, местных новостейизображения и другие подобные Google усилия легко.(Я только что закончил на этой неделе, через год).
http://developer.torello.directory/JavaHTML/index.html
import Torello.HTML.*;
import java.util.*;
import java.io.*;
public class GetImage
{
public static void main(String[] argv) throws IOException
{
Vector<HTMLNode> page = HTMLPage.getPageTokens(new java.net.URL("My URL.html"), false);
int pos = InnerTagFind.first(page, "div", "class", tagValue -> tagValue.equals("overflow-image"));
TagNode tn = TagNodeGet.first(page, pos, -1, TC.OpeningTags, "img");
String href = Tags.getInnerTagValue(tn, Tags.IMG_SRC);
System.out.println("The Image URL is: " + href);
}
}